2014-09-15 分類: 網(wǎng)站建設(shè)
為了更好的監(jiān)測網(wǎng)站優(yōu)化的情況,站長們幾乎都會統(tǒng)計一些日常的數(shù)據(jù)更新。網(wǎng)站是否出現(xiàn)抓取異常的情況也在數(shù)據(jù)統(tǒng)計的行列,根據(jù)記錄的情況,站長們還要因地制宜做一些分析和優(yōu)化措施。
1.服務(wù)器的問題
服務(wù)器不穩(wěn)定的情況下會造成網(wǎng)站終端訪問不了,無法鏈接?;蛘叱霈F(xiàn)一直連接不上的情況,針對這種情況就只能換好的服務(wù)器了,千萬不貪圖小便宜,最終害了網(wǎng)站。
2.運營商的問題
國內(nèi)正常情況下都使用的是電信和聯(lián)通這兩種,一般用的是雙線服務(wù),如果使用了單線服務(wù)造成的網(wǎng)站無法訪問,那么最好升級國雙線服務(wù)或者使用CND服務(wù)等方法解決。
3.DNS異常
當蜘蛛無法解析你網(wǎng)站的IP的時候,就會出現(xiàn)DNS異?;蛘逥NS錯誤問題,可能是服務(wù)商把蜘蛛設(shè)置封禁了,或者網(wǎng)站IP的地址不正確造成的??墒褂霉ぞ邫z查域名是否解析正確,如果不正確或者無法解析,那么聯(lián)系域名商更新IP解決即可。
4.禁止蜘蛛抓取
這個就要看查看相關(guān)的代碼設(shè)置,是否有禁止Baiduspider抓取設(shè)置,或者robots協(xié)議的設(shè)置問題等。
5.UA封禁
UA是用戶代理(User-Agent),服務(wù)器通過UA識別訪問者的身份,返回異常頁面(如403,500)或跳轉(zhuǎn)到其他頁面的情況,即為UA封禁。
當網(wǎng)站不希望Baiduspider訪問的時候,需要設(shè)置對應(yīng)的訪問權(quán)限。
6.死鏈
死鏈是網(wǎng)站中的無效頁面,沒有任何價值并且出現(xiàn)訪問無效的情況。有協(xié)議死鏈和內(nèi)容死鏈。
對于死鏈問題,通過采用404頁面制作或統(tǒng)計好404頁面向百度站長平臺提交數(shù)據(jù)即可。
7.異常跳轉(zhuǎn)
異常跳轉(zhuǎn)也就是當前的無效頁面比如死鏈、已經(jīng)刪除的頁面通過301直接跳轉(zhuǎn)到首頁或相關(guān)目錄頁面的情況。
或者是跳轉(zhuǎn)到出錯、無效的頁面上。
這些情況都需要重視。主要還是301協(xié)議的問題,沒有必要的建議不要設(shè)置即可。
8.其它情況
a.JS代碼問題,JS代碼與搜索引擎并不友好,也不是重點識別的對象,如果JS代碼蜘蛛識別不了,那么也會現(xiàn)問題異常。
b.百度會根據(jù)網(wǎng)站的內(nèi)容、規(guī)模、訪問情況等自動設(shè)定一個合理的抓取壓力。但是異常情況下,壓力控制失常的話,會導(dǎo)致服務(wù)器負荷作出自我保護的突發(fā)性封禁情況。
c.壓力過大引起的偶然封禁:百度會根據(jù)站點的規(guī)模、訪問量等信息,自動設(shè)定一個合理的抓取壓力。但是在異常情況下,如壓力控制失常時,服務(wù)器會根據(jù)自身負荷進行保護性的偶然封禁。這種情況下,請在返回碼中返回503(其含義是“ServiceUnavailable”),這樣搜索引擎蜘蛛會過段時間再來嘗試抓取這個鏈接,如果網(wǎng)站已空閑,則會被成功抓取。
分享標題:網(wǎng)站抓取異常的常見原因是什么?
分享網(wǎng)址:http://muchs.cn/news14/29664.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計、搜索引擎優(yōu)化、Google、定制網(wǎng)站、網(wǎng)站設(shè)計公司、移動網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容