九色91_成人精品一区二区三区中文字幕_国产精品久久久久一区二区三区_欧美精品久久_国产精品99久久久久久久vr_www.国产视频

Hello! 歡迎來到小浪云!


云服務器Apache利用USER_AGENT屏蔽惡意蜘蛛


avatar
小浪云 2024-07-15 194

 

最近發現日志里有很多沒見過的蜘蛛UA,基本上都是國外的一些搜索引擎,或者很本不是搜索引擎,有的抓取頻率很高,剛開始設置了下robots.txt,因為他們首先都抓取了robots.txt,應該是遵守規則的,沒想到人家只是走個過場,并沒有把robot.txt放在眼里。

 

apache可以用.htaccess文件來通過useragent來屏蔽一些訪問,搜了一下,大概可以這么做:

 

 

 

 

.htaccess

SetEnvifNoCase?User-Agent?^.*Scrapy.*?bad_bot

SetEnvifNoCase?User-Agent?^.*SemrushBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*ExtLinksBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*YandexBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*MauiBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*Python.*?bad_bot

SetEnvifNoCase?User-Agent?^.*NetcraftSurveyAgent.*?bad_bot

Deny?from?env=bad_bot

這樣當這些匹配的useragent就會被返回403禁止訪問。

 

可是第二天發現有幾個useragent瘋狂的訪問robot.txt,反正都不遵守規則,那么執著的訪問robots.txt干什么。。。。。

 

于是我換了一種方法,打算用302(301也一樣啦,對這些惡意蜘蛛沒那么講究)把他們轉走。

 

.htaccess

云服務器Apache利用USER_AGENT屏蔽惡意蜘蛛

這樣,就都被302到www.xlyVPS.com了,現在再看那些未知的蜘蛛基本不會在主站亂爬了。

 

另:.htaccess的正則:”^”代表字符串的開始,”.*”代表任意字符。

 

NC代表不區分大小寫,OR代表或者,L的意思是一旦有符合條件的規則就不再執行下面的規則,所以這些語句要放在wordpress等程序默認偽靜態規則的前面。

相關閱讀

主站蜘蛛池模板: 天天夜夜操 | 伊人伊人伊人 | 国产丝袜一区二区三区免费视频 | 欧美精品乱码久久久久久按摩 | 欧洲高清转码区一二区 | 欧美a级成人淫片免费看 | 欧美成人精品一区二区男人看 | 久久男人 | 中文字幕综合 | 国产精品日韩欧美一区二区三区 | 欧美 中文字幕 | 久久精品日产第一区二区三区 | 国产精品久久久久久久久图文区 | www.久久 | 欧洲高清转码区一二区 | 成人免费视频一区二区 | 国产97碰免费视频 | 亚洲高清在线观看 | 亚洲国产精品成人 | 午夜影院在线观看 | 欧美日韩综合一区 | 国户精品久久久久久久久久久不卡 | 欧美韩一区二区三区 | 日韩1区2区| 亚洲女人天堂网 | 瑟瑟激情 | 国产www成人 | 国产高清一区二区 | 久99久视频 | 久久av一区二区三区 | 亚洲精品电影网在线观看 | 日韩成年人视频在线 | 91精品国产综合久久久久久蜜臀 | 欧美区日韩区 | 日韩精品一区二 | 欧美一区二区三区在线观看 | 成人网av | 一级特黄色毛片 | 黄色毛片在线观看 | 九九热这里只有精品在线观看 | 欧美2区|