網(wǎng)頁(yè)抓取異常?受什么因素影響?

2020-09-17    分類(lèi): 網(wǎng)站建設(shè)

很多人在網(wǎng)站推廣的時(shí)候,時(shí)常都會(huì)使用一些便捷的工具,讓我們可以有效的監(jiān)控網(wǎng)站的具體情況,其中百度站長(zhǎng)就是其中之一,在使用站長(zhǎng)工具的時(shí)候,就會(huì)出現(xiàn)抓取異常的情況,那么這種情況是受何因素的影響呢?
一、網(wǎng)站異常
1、連接錯(cuò)誤
無(wú)法連接或者連接建立后對(duì)方服務(wù)器拒絕。
2、抓取超時(shí)
抓取請(qǐng)求連接建立后,下載頁(yè)面速度過(guò)慢,導(dǎo)致超時(shí),可能原因服務(wù)器過(guò)載,帶寬不足。
3、連接超時(shí)
抓取請(qǐng)求連接超時(shí),可能原因服務(wù)器過(guò)載,網(wǎng)絡(luò)不穩(wěn)定??梢栽俅螠y(cè)試抓取
4、dns異常
當(dāng)Baiduspider無(wú)法解析您網(wǎng)站的IP時(shí),會(huì)出現(xiàn)DNS異常??赡苁悄木W(wǎng)站IP地址錯(cuò)誤,或者域名服務(wù)商把Baiduspider封禁。請(qǐng)使用WHOIS或者h(yuǎn)ost查詢(xún)自己網(wǎng)站IP地址是否正確且可解析,如果不正確或無(wú)法解析,請(qǐng)與域名注冊(cè)商聯(lián)系,更新您的IP地址。
二、鏈接異常
1、服務(wù)器錯(cuò)誤
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是5XX。
2、找不到頁(yè)面
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是404。
3、訪問(wèn)被拒絕
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是403。
4、其他錯(cuò)誤
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是4XX,不包括403和404。
網(wǎng)頁(yè)抓取異常?受什么因素影響?當(dāng)網(wǎng)站出現(xiàn)抓取異常的時(shí)候,這是會(huì)對(duì)網(wǎng)站的關(guān)鍵詞排名出現(xiàn)很多影響的,從而也會(huì)導(dǎo)致網(wǎng)站排名出現(xiàn)一定的波動(dòng),降低搜索引擎對(duì)網(wǎng)站的信任度,因此就會(huì)給網(wǎng)站帶來(lái)很多的負(fù)面影響。

網(wǎng)站欄目:網(wǎng)頁(yè)抓取異常?受什么因素影響?
網(wǎng)頁(yè)網(wǎng)址:http://www.muchs.cn/news49/86399.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計(jì)、做網(wǎng)站、網(wǎng)站排名、企業(yè)建站、云服務(wù)器、微信公眾號(hào)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷(xiāo)型網(wǎng)站建設(shè)