網(wǎng)站抓取異常的常見原因是什么?

2014-09-15    分類: 網(wǎng)站建設(shè)

為了更好的監(jiān)測網(wǎng)站優(yōu)化的情況,站長們幾乎都會統(tǒng)計一些日常的數(shù)據(jù)更新。網(wǎng)站是否出現(xiàn)抓取異常的情況也在數(shù)據(jù)統(tǒng)計的行列,根據(jù)記錄的情況,站長們還要因地制宜做一些分析和優(yōu)化措施。

網(wǎng)站抓取異常的常見原因是什么?

1.服務(wù)器的問題

服務(wù)器不穩(wěn)定的情況下會造成網(wǎng)站終端訪問不了,無法鏈接。或者出現(xiàn)一直連接不上的情況,針對這種情況就只能換好的服務(wù)器了,千萬不貪圖小便宜,最終害了網(wǎng)站。

2.運(yùn)營商的問題

國內(nèi)正常情況下都使用的是電信和聯(lián)通這兩種,一般用的是雙線服務(wù),如果使用了單線服務(wù)造成的網(wǎng)站無法訪問,那么最好升級國雙線服務(wù)或者使用CND服務(wù)等方法解決。

3.DNS異常

當(dāng)蜘蛛無法解析你網(wǎng)站的IP的時候,就會出現(xiàn)DNS異常或者DNS錯誤問題,可能是服務(wù)商把蜘蛛設(shè)置封禁了,或者網(wǎng)站IP的地址不正確造成的??墒褂霉ぞ邫z查域名是否解析正確,如果不正確或者無法解析,那么聯(lián)系域名商更新IP解決即可。

網(wǎng)站抓取異常的常見原因是什么?

4.禁止蜘蛛抓取

這個就要看查看相關(guān)的代碼設(shè)置,是否有禁止Baiduspider抓取設(shè)置,或者robots協(xié)議的設(shè)置問題等。

5.UA封禁

UA是用戶代理(User-Agent),服務(wù)器通過UA識別訪問者的身份,返回異常頁面(如403,500)或跳轉(zhuǎn)到其他頁面的情況,即為UA封禁。

當(dāng)網(wǎng)站不希望Baiduspider訪問的時候,需要設(shè)置對應(yīng)的訪問權(quán)限。

6.死鏈

死鏈?zhǔn)蔷W(wǎng)站中的無效頁面,沒有任何價值并且出現(xiàn)訪問無效的情況。有協(xié)議死鏈和內(nèi)容死鏈。

對于死鏈問題,通過采用404頁面制作或統(tǒng)計好404頁面向百度站長平臺提交數(shù)據(jù)即可。

7.異常跳轉(zhuǎn)

異常跳轉(zhuǎn)也就是當(dāng)前的無效頁面比如死鏈、已經(jīng)刪除的頁面通過301直接跳轉(zhuǎn)到首頁或相關(guān)目錄頁面的情況。

或者是跳轉(zhuǎn)到出錯、無效的頁面上。

這些情況都需要重視。主要還是301協(xié)議的問題,沒有必要的建議不要設(shè)置即可。

網(wǎng)站抓取異常的常見原因是什么?

8.其它情況

a.JS代碼問題,JS代碼與搜索引擎并不友好,也不是重點(diǎn)識別的對象,如果JS代碼蜘蛛識別不了,那么也會現(xiàn)問題異常。

b.百度會根據(jù)網(wǎng)站的內(nèi)容、規(guī)模、訪問情況等自動設(shè)定一個合理的抓取壓力。但是異常情況下,壓力控制失常的話,會導(dǎo)致服務(wù)器負(fù)荷作出自我保護(hù)的突發(fā)性封禁情況。

c.壓力過大引起的偶然封禁:百度會根據(jù)站點(diǎn)的規(guī)模、訪問量等信息,自動設(shè)定一個合理的抓取壓力。但是在異常情況下,如壓力控制失常時,服務(wù)器會根據(jù)自身負(fù)荷進(jìn)行保護(hù)性的偶然封禁。這種情況下,請在返回碼中返回503(其含義是“ServiceUnavailable”),這樣搜索引擎蜘蛛會過段時間再來嘗試抓取這個鏈接,如果網(wǎng)站已空閑,則會被成功抓取。

文章標(biāo)題:網(wǎng)站抓取異常的常見原因是什么?
瀏覽地址:http://www.muchs.cn/news/29664.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設(shè)、定制開發(fā)、網(wǎng)站改版、網(wǎng)站制作、動態(tài)網(wǎng)站、關(guān)鍵詞優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司