數(shù)據(jù)分析更有利于開展網(wǎng)站SEO優(yōu)化

2023-04-08    分類: 網(wǎng)站建設(shè)

會剖析網(wǎng)站日志的優(yōu)化才是好優(yōu)化,也是最基礎(chǔ)的一步,經(jīng)過剖析確診能夠了解到網(wǎng)站的健康狀況,使用這些數(shù)據(jù)更有利于開展網(wǎng)站SEO優(yōu)化。


經(jīng)過網(wǎng)站日志能夠清楚的得知用戶在什么IP、什么時刻、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下拜訪了你網(wǎng)站的哪個頁面,是否拜訪成功。關(guān)于專業(yè)從事搜索引擎優(yōu)化工作者而言,網(wǎng)站日志能夠記載各搜索引擎蜘蛛機器人匍匐網(wǎng)站的詳細情況,例如:哪個IP的百度蜘蛛機器人在哪天拜訪了網(wǎng)站多少次,拜訪了哪些頁面,以及拜訪頁面時回來的HTTP狀況碼。


常見的蜘蛛名稱:


Baiduspider:百度蜘蛛


Baiduspider-Image:百度圖片蜘蛛


Googlebot:谷歌機器人


Googlebot-Image:谷歌圖片機器人


360Spider:360蜘蛛


sogou spider:搜狗蜘蛛

微信截圖_20190716170400.

一、網(wǎng)站日志的作用


1、經(jīng)過網(wǎng)站日志能夠了解蜘蛛對網(wǎng)站的基本爬取情況,能夠知道蜘蛛的爬取軌道和爬取量。


2、網(wǎng)站的更新頻率也和網(wǎng)站日志中蜘蛛抓取的頻率有關(guān),一般來說更新頻率越高,蜘蛛的抓取頻率越高,而咱們網(wǎng)站的更新不僅僅只是新內(nèi)容的添加一起還有咱們的微調(diào)操作。


3、咱們能夠依據(jù)網(wǎng)站日志的反響情況,對咱們的空間的某些事情和問題提前進行預(yù)警,由于服務(wù)器假如出問題的話在網(wǎng)站日志中會第一時刻反映出來,要知道服務(wù)器的安穩(wěn)速度和翻開速度兩者都會直接影響咱們的網(wǎng)站。


4、經(jīng)過網(wǎng)站日志咱們能夠知道網(wǎng)站的那些頁面是很受蜘蛛歡迎的,而哪些頁面是蜘蛛連碰都不去碰的,一起咱們還能發(fā)現(xiàn)有一些蜘蛛由于是過度爬取對咱們的服務(wù)器資源損耗是很大的,咱們要進行屏蔽工作。


二、如何下載網(wǎng)站日志


1、首要咱們的空間要支撐網(wǎng)站日志下載,這一點是很重要的,在購買空間時候需事前了解下是否支撐日志下載,由于有的服務(wù)商是不供給這項服務(wù)的,假如支撐的話空間后臺一般都有日志W(wǎng)ebLog日志下載這個功能把它下載到根目錄在用FTP傳到本地就能夠,服務(wù)器的話能夠設(shè)置將日志文件下載到指定途徑。


2、這兒有個很重要的問題,網(wǎng)站日志強烈建議設(shè)置成每小時生成一次,小型的企業(yè)站和頁面內(nèi)容較少的網(wǎng)站能夠設(shè)置成一天,它默認是一天,假如內(nèi)容多或者大型站設(shè)置成一天生成一次,那么一天只生成一個文件,這個文件會相當?shù)拇?,咱們有時電腦翻開是會形成死機,設(shè)置的話找空間商協(xié)調(diào)設(shè)置即可。


三、網(wǎng)站日志數(shù)據(jù)剖析


1、網(wǎng)站日志中數(shù)據(jù)量過大,所以咱們一般需求借助網(wǎng)站日志剖析東西來檢查。常用的日志剖析東西有:光年日志剖析東西、web logexploer、WPS表格等117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1"500 19967 "-" "Mozilla/4.0 (compatible; MSIE 8.0;Windows NT 5.1; Trident/4.0;AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"剖析:


117.26.203.167拜訪ip;


02/May/2011:01:57:44 -0700拜訪日期 -時區(qū);GET/index.php HTTP/1.1依據(jù)HTTP/1.1協(xié)議抓取(域名下)/index.php這個頁面(GET表明服務(wù)器動作);500服務(wù)器呼應(yīng)狀況碼;服務(wù)器呼應(yīng)狀況碼通常狀況碼有以下幾種:200,301,302,304,404,500等。200代表用戶成功的獲取到了所請求的文件,假如是搜索引擎,則證明蜘蛛在這次匍匐中順利的發(fā)現(xiàn)了一些新的內(nèi)容。而301則代表用戶所拜訪的某個頁面url現(xiàn)已做了301重定向(永久性)處理,302則是暫時性重定向。404則代表所拜訪的頁面現(xiàn)已不存在了,或者說拜訪的url根本就是個過錯的。500則是服務(wù)器的過錯。


19967表明抓取了19967個字節(jié);


Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0;AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar表明拜訪者使用火狐瀏覽器及AlexaToolbar等拜訪端信息;2、假如你的日志里格局不是如此,則代表日志格局設(shè)置不同。


3、很多日志里能夠看到 200 0 0和200 0 64則都代表正常抓取。


4、抓取頻率是經(jīng)過檢查每日的日志里百度蜘蛛抓取次數(shù)來獲悉。抓取頻率并沒有一個規(guī)范的時刻表或頻率數(shù)字,咱們一般經(jīng)過多日的日志比照來判別,當然,咱們希望百度蜘蛛每日抓取的次數(shù)越多越好。


5、有時候咱們的途徑不一致出現(xiàn)帶斜杠和不帶斜杠的問題,蜘蛛會自動識別為301跳轉(zhuǎn)到帶斜杠的頁面,這兒咱們就發(fā)現(xiàn)了搜索引擎是能夠判別咱們的目錄的,所以咱們要對咱們的目錄進行一致。


6、咱們剖析日志剖析時刻長了,咱們能夠看出蜘蛛的抓取規(guī)則,同一目錄下面的單個文件的抓取頻率間隔和不同目錄的抓取頻率間隔都能夠看出來,這些抓取頻率間隔時刻是蜘蛛依據(jù)網(wǎng)站權(quán)重和網(wǎng)站更新頻率來自動確認的。


7、蜘蛛關(guān)于咱們的頁面的抓取是分等級的,是依據(jù)權(quán)重依次遞減的,一般順序為主頁、目錄頁、內(nèi)頁。


四、經(jīng)過網(wǎng)站日志咱們能知道什么?


1、咱們買的空間是否能夠安穩(wěn)?


2、蜘蛛對咱們的那些頁面比較喜歡而對哪些不喜歡?


3、蜘蛛什么時候抓取咱們的網(wǎng)站頻頻,咱們需求什么時候更新內(nèi)容?


所以不管是新站仍是老網(wǎng)站,不管你做百度仍是Google咱們都能經(jīng)過網(wǎng)站日志剖析出來搜索引擎蜘蛛抓取的情況;假如網(wǎng)站長時刻收錄有問題,那么咱們也能夠比照網(wǎng)站日志中的搜索引擎蜘蛛行為,來了解網(wǎng)站是哪方面出了問題;假如網(wǎng)站被封,或者被K,咱們都能夠經(jīng)過觀察網(wǎng)站日志的情況來了解原因出在什么地方。咱們要看的網(wǎng)站日志的剖析和確診就像給網(wǎng)站看病一樣,咱們經(jīng)過網(wǎng)站日志的剖析,能夠簡單明了的就知道網(wǎng)站的健康狀況,能夠利于咱們更好的做網(wǎng)站優(yōu)化,所以關(guān)于真實的SEO高手而言,剖析蜘蛛日志是最直觀,最有效的額。


當前題目:數(shù)據(jù)分析更有利于開展網(wǎng)站SEO優(yōu)化
文章路徑:http://www.muchs.cn/news47/252097.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、網(wǎng)站收錄、小程序開發(fā)、ChatGPT、網(wǎng)站排名、用戶體驗

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

小程序開發(fā)