如何查看網(wǎng)站被百度抓取的情況?

2023-03-18    分類: 網(wǎng)站建設

百度用于抓取網(wǎng)頁的程序叫做Baiduspider - 百度蜘蛛,我們查看網(wǎng)站被百度抓取的情況主要是分析,網(wǎng)站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態(tài)碼。

如何查看網(wǎng)站被百度抓取的情況?

查看日志的方式:

通過FTP,在網(wǎng)站根目錄找到一個日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網(wǎng)站的日志,記錄了網(wǎng)站被訪問和操作的情況。

因為各個服務器和主機的情況不同,不同的主機日志功能記錄的內(nèi)容不同,有的甚至沒有日志功能。

日志內(nèi)容如下:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"

分析:

GET /bbs/thread-7303-1-1.html?? 代表,抓取/bbs/thread-7303-1-1.html 這個頁面。

200? 代表成功抓取。

8450? 代表抓取了8450個字節(jié)。

如果你的日志里格式不是如此,則代表日志格式設置不同。

很多日志里可以看到 200 0 0和200 0? 64 則都代表正常抓取。

抓取頻率是通過查看每日的日志里百度蜘蛛抓取次數(shù)來獲知。抓取頻率并沒有一個規(guī)范的時間表或頻率數(shù)字,我們一般通過多日的日志對比來判斷。當然,我們希望百度蜘蛛每日抓取的次數(shù)越多越好。

在網(wǎng)站出現(xiàn)問題的情況下,通過查看網(wǎng)站日志,查看網(wǎng)站的HTTP返回值是否正常。

網(wǎng)頁題目:如何查看網(wǎng)站被百度抓取的情況?
文章網(wǎng)址:http://muchs.cn/news/245308.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、網(wǎng)站導航、搜索引擎優(yōu)化響應式網(wǎng)站、網(wǎng)站收錄、用戶體驗

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站