国产女人被狂躁到高潮小说,亚洲日韩一区二区三区,色窝窝无码一区二区三区成人网站 ,丰满岳乱妇在线观看中字无码

400-800-9385
網(wǎng)站建設(shè)資訊詳細(xì)

詳談方維站長工具如何解決抓取谷歌結(jié)果返回403錯(cuò)誤問題

發(fā)表日期:2012-10-24 00:00:00   作者來源:方維網(wǎng)絡(luò)   瀏覽:6839   標(biāo)簽:方維站長工具    谷歌    
    方維站長工具能查詢網(wǎng)站各大搜索引擎收錄數(shù)量和百度權(quán)重、百度相關(guān)域、百度快照、百度近日收錄、網(wǎng)站歷史查詢、網(wǎng)站升級(jí)查詢等。但是在抓取谷歌網(wǎng)頁結(jié)果的時(shí)候,返回403錯(cuò)誤問題,同樣的地址,用瀏覽器打開時(shí)顯示正常的搜索結(jié)果頁面,但用程序抓取就出現(xiàn)403錯(cuò)誤頁面,里面講的是判斷訪問對(duì)象是機(jī)器,可見谷歌對(duì)程序或軟件抓取結(jié)果已經(jīng)做了相關(guān)的措施,因?yàn)楣雀?1算法已經(jīng)生效,防止機(jī)器抓取可以防止機(jī)器點(diǎn)擊。所以,方維站長工具一直因?yàn)檫@個(gè)原因無法抓取谷歌收錄、谷歌排名數(shù)據(jù)。

    一直以來,我都在網(wǎng)上尋找問題的答案,因?yàn)槲铱从行┱鹃L工具能夠抓取,所以問題一定有解決的方法,我開始懷疑是路徑不對(duì),不過我發(fā)覺也只有這個(gè)路徑,于是我把目標(biāo)指向了抓取網(wǎng)頁的程序,采用其他方法,沒想到,讓我驚奇的結(jié)果出來了。用Microsoft.XMLHTTP對(duì)象獲取就可以抓取到正常結(jié)果,我以前是用MSXML2.SERVERXMLHTTP.3.0對(duì)象來抓取的。代碼如下。

Function getHTTPPage(url,charcode)
    dim objXML
    'set objXML=createobject("MSXML2.SERVERXMLHTTP.3.0")  '調(diào)用XMLHTTP組件,測(cè)試空間是否支持XMLHTTP
    set objXML=createobject("Microsoft.XMLHTTP")
 objXML.open "GET",url,false 'false表示以同步的方式獲取網(wǎng)頁代碼,了解什么是同步?什么是異步?
    objXML.send() '發(fā)送
    getHTTPPage=bBytesToBstr(objXML.responseBody,charcode)'返回信息,同時(shí)用函數(shù)定義編碼
    set objXML=nothing'關(guān)閉
End Function


Function bBytesToBstr(body,charcode)
    dim objstream
    set objstream = CreateObject("adodb.stream") '//調(diào)用adodb.stream組件
    objstream.Type = 1
    objstream.Mode =3
    objstream.Open
    objstream.Write body
    objstream.Position = 0
    objstream.Type = 2
    objstream.Charset = charcode '轉(zhuǎn)換原來默認(rèn)的UTF-8編碼轉(zhuǎn)換成GB2312編碼,否則直接用XMLHTTP調(diào)用有中文字符的網(wǎng)頁得到的將是亂碼
    bBytesToBstr = objstream.ReadText
    objstream.Close
    set objstream = nothing
end Function

通過使用這個(gè)抓取函數(shù),谷歌的收錄數(shù)據(jù)、排名數(shù)據(jù)都可以正常獲取了,從而解決了這個(gè)BUG。

方維站長工具正在一步步完善,而且源代碼全部開源,只希望保留版權(quán)信息。

如沒特殊注明,文章均為方維網(wǎng)絡(luò)原創(chuàng),轉(zhuǎn)載請(qǐng)注明來自http://www.sdlwjx666.com/news/1717.html
相關(guān)網(wǎng)站設(shè)計(jì)案例