動(dòng)態(tài)程序防采集的新方法發(fā)布者:本站 時(shí)間:2020-05-06 16:05:40
昨天在網(wǎng)上看到一個(gè)防采集軟件,說(shuō)采集只訪(fǎng)問(wèn)當(dāng)前網(wǎng)頁(yè),不會(huì)訪(fǎng)問(wèn)網(wǎng)頁(yè)的圖片、JS等,今天突然想到,通過(guò)動(dòng)態(tài)程序和Js訪(fǎng)問(wèn)分別記錄訪(fǎng)問(wèn)者的IP,然后進(jìn)行IP判斷,由于采集過(guò)程不會(huì)訪(fǎng)問(wèn)JS,采集的時(shí)候只會(huì)查到用動(dòng)態(tài)程序記錄的IP,而不會(huì)有通過(guò)JS記錄的IP,從而實(shí)現(xiàn)網(wǎng)頁(yè)程序的防采集。
防采集的原理非常簡(jiǎn)單,首先放一段動(dòng)態(tài)語(yǔ)句,把訪(fǎng)問(wèn)者的IP加入到數(shù)據(jù)庫(kù)的一個(gè)表里,然后在頁(yè)面底部加入一個(gè)JS,JS直接訪(fǎng)問(wèn)動(dòng)態(tài)頁(yè)面,將訪(fǎng)問(wèn)者的IP加入到數(shù)據(jù)庫(kù)的另外一個(gè)表里。再次訪(fǎng)問(wèn)的時(shí)候,從兩個(gè)表里讀IP數(shù)據(jù),然后判斷時(shí)間差,如果只在第一個(gè)表里找到,在第二個(gè)表里找不到,或者時(shí)間差超過(guò)10秒,則認(rèn)為是采集。
優(yōu)點(diǎn)
1.部署簡(jiǎn)單,只要是動(dòng)態(tài)語(yǔ)言就能很容易的實(shí)現(xiàn),無(wú)需借助服務(wù)器端程序
2.殺傷力大,幾乎能封殺所有的采集過(guò)程
缺點(diǎn)
1.第一個(gè)缺點(diǎn)還是殺傷力大,如果需要實(shí)際使用需要考慮一些特殊情況,以免誤殺已經(jīng)殺掉搜索爬蟲(chóng)
2.只適用于動(dòng)態(tài)網(wǎng)頁(yè),靜態(tài)頁(yè)面就沒(méi)法用了
流程寫(xiě)的比較亂,不過(guò)原理本身就不是很復(fù)雜,下面附上程序例子,懂ASP的應(yīng)該很快就能看懂。
程序例子(ASP+ACCESS)
1.建立數(shù)據(jù)庫(kù)
表1:Ip1,字段Ip1_Adderss(文本),Ip1_Time(日期/時(shí)間,默認(rèn)值=Now())
表2:Ip2,字段Ip2_Adderss(文本),Ip2_Time(日期/時(shí)間,默認(rèn)值=Now())
選擇我們,優(yōu)質(zhì)服務(wù),不容錯(cuò)過(guò)
1. 優(yōu)秀的網(wǎng)絡(luò)資源,強(qiáng)大的網(wǎng)站優(yōu)化技術(shù),穩(wěn)定的網(wǎng)站和速度保證
2. 15年上海網(wǎng)站建設(shè)經(jīng)驗(yàn),優(yōu)秀的技術(shù)和設(shè)計(jì)水平,更放心
3. 全程省心服務(wù),不必?fù)?dān)心自己不懂網(wǎng)絡(luò),更省心。
------------------------------------------------------------
24小時(shí)聯(lián)系電話(huà):021-58370032