網(wǎng)站日志如何分析之實(shí)例解說(shuō)

2021-12-16    分類: 網(wǎng)站建設(shè)

因?yàn)樵诙宋绻?jié)前。筆者做過(guò)一個(gè)實(shí)驗(yàn),并且寫了一篇實(shí)驗(yàn)報(bào)告《探究搜索引擎不收錄網(wǎng)站內(nèi)容與外鏈因素有無(wú)關(guān)系的實(shí)驗(yàn)》,具體實(shí)驗(yàn)內(nèi)容,在這里就不再多說(shuō)。因?yàn)楣P者針對(duì)leyuanbaby.com做的這個(gè)實(shí)驗(yàn)結(jié)論,并沒(méi)有達(dá)到想要的效果,所以我還沒(méi)有死心,就通過(guò)網(wǎng)站日志來(lái)觀察到底蜘蛛有沒(méi)有爬行我未收錄的鏈接。這個(gè)過(guò)程中,獲得了一些關(guān)于分析網(wǎng)站日志心得,在這里分享給大家。

通過(guò)網(wǎng)站日志我們可以清晰的看到用戶和搜索引擎蜘蛛訪問(wèn)網(wǎng)站的行為,并形成一個(gè)數(shù)據(jù),這些數(shù)據(jù)可以讓我們知道搜索引擎對(duì)于網(wǎng)站的態(tài)度,以及網(wǎng)站的健康情況。通過(guò)網(wǎng)站日志我們獲取的指標(biāo)有很多,比如:訪問(wèn)次數(shù)、停留時(shí)間、抓取量、目錄抓取統(tǒng)計(jì)、頁(yè)面抓取統(tǒng)計(jì)、蜘蛛訪問(wèn)IP、HTTP狀態(tài)碼、蜘蛛活躍時(shí)段、蜘蛛爬取路徑等。

那么下面就通過(guò)實(shí)例來(lái)看看,網(wǎng)站日志是如何分析的:

#Software: Microsoft Internet Information Services 6.0

#Version: 1.0

#Date: 2013-05-27 16:44:28

#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-agent) sc-status sc- substatus sc-win32-status

2013-05-27 16:44:27 W3SVC195483716 61.152.94.150 GET /index.html - 80 - 123.125.71.84 Mozilla/5.0+(compatible; +Baiduspider/2.0;++http://www.aoxsys.net/search/spider.html) 200 0 64

2013-05-27 16:45:15 W3SVC195483716 61.152.94.150 GET /index.html - 80 - 220.181.108.176 Mozilla/5.0+(compatible; +Baiduspider/2.0;++http://www.aoxsys.net/search/spider.html) 200 0 64

上面是我的站點(diǎn)leyuanbaby.com的5月27的網(wǎng)站日志情況,我們就根據(jù)以上的一段日志來(lái)分析,如何查看網(wǎng)站日志。

1.首先我們看到Software,這是指軟件的名稱,version表示的是軟件的版本號(hào),這兩項(xiàng)就不再多說(shuō)。

2.Date表示的是訪問(wèn)日期,即百度蜘蛛是什么時(shí)間來(lái)爬行的你的站點(diǎn)。

3. s-sitename:表示你的虛擬主機(jī)的代稱或機(jī)器碼;

4.s-ip:服務(wù)器IP;

5.cs-method:表示訪問(wèn)方法或發(fā)生的請(qǐng)求/提交事件,常見的有兩種:一個(gè)是GET,就是平常我們打開一個(gè)URL訪問(wèn)的動(dòng)作,另一個(gè)是POST,提交表單時(shí)的動(dòng)作;

6.cs-uri-stem:用戶在當(dāng)前時(shí)間訪問(wèn)哪一個(gè)文件或具體頁(yè)面;

7.cs-uri-query:是指訪問(wèn)地址的附帶參數(shù),如asp文件后面的字符串id=12等等,如果沒(méi)有參數(shù)則用“-”表示;

8.s-port:訪問(wèn)的端口

9.cs-username:訪問(wèn)者名稱,如果沒(méi)有參數(shù)則用“-”表示;

10.c-ip:訪問(wèn)者IP

11.cs(User-agent):訪問(wèn)的搜索引擎和蜘蛛名稱;

12.sc-status:Http狀態(tài)碼,200表示成功,403表示沒(méi)有權(quán)限,404表示打不到該頁(yè)面,500表示程序有錯(cuò);

通過(guò)上面的實(shí)例,我們已經(jīng)知道了分析網(wǎng)站日志要看的各項(xiàng)數(shù)據(jù),那么我們分析網(wǎng)站日志能給我們帶來(lái)什么作用和提示呢筆者認(rèn)為,網(wǎng)站日志可以給我們帶來(lái)6項(xiàng)提示:

1.清晰明了的知道百度蜘蛛抓取網(wǎng)頁(yè)的情況。

2.根據(jù)蜘蛛的爬行情況,我們可以看出搜索引擎收錄網(wǎng)頁(yè)的原則。

3.搜索引擎蜘蛛爬行站點(diǎn)是否正常,從而明白網(wǎng)站優(yōu)化手段是否健康。

4.搜索引擎蜘蛛在哪個(gè)頁(yè)面爬行最多,為什么喜歡這一頁(yè)面,是否其他頁(yè)面要向此頁(yè)面學(xué)習(xí)。

5.搜索引擎蜘蛛很少訪問(wèn)的頁(yè)面帶給我們的提示是,這個(gè)頁(yè)面可能存在一些搜索引擎不喜愛的東西,我們要去總結(jié)修改。

6.我們卸載robotS中的內(nèi)容,搜索引擎有無(wú)訪問(wèn)

同時(shí)我們需要特別注意的是Http狀態(tài)碼,通過(guò)狀態(tài)碼,我們可以更明確的知道,這一頁(yè)面存在什么樣的問(wèn)題,蜘蛛是如何評(píng)判的。Http狀態(tài)碼有很多,是每一位站長(zhǎng)需要掌握和熟記的,在這里就不做多解釋。

網(wǎng)站的健康分析、蜘蛛爬行規(guī)則等均是通過(guò)網(wǎng)站日志來(lái)觀察,可以說(shuō)網(wǎng)站日志就是蜘蛛和站長(zhǎng)們交流的一種方式,學(xué)會(huì)看網(wǎng)站日志,對(duì)于網(wǎng)站優(yōu)化有著很重要的作用。

分享題目:網(wǎng)站日志如何分析之實(shí)例解說(shuō)
URL網(wǎng)址:http://www.muchs.cn/news10/140710.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、Google、做網(wǎng)站、網(wǎng)頁(yè)設(shè)計(jì)公司、網(wǎng)站導(dǎo)航、外貿(mào)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

綿陽(yáng)服務(wù)器托管