SEO入門:搜索引擎蜘蛛的工作原理

2013-07-02    分類: 網站建設

  不少SEO優(yōu)化專員在做搜索引擎優(yōu)化的時候,一開始都著急跟著技巧方式來執(zhí)行,沒有把原理吃透。其實如果能夠花點時間去對搜索引擎蜘蛛抓取的原理進行了解,相關的SEO方法原理也能夠很快上手。而且還能夠指導我們開展工作,下面同創(chuàng)新互聯一起來了解蜘蛛是怎么開展工作的吧。

SEO入門:搜索引擎蜘蛛的工作原理

  一、常見蜘蛛抓取的策略:

  1、深度優(yōu)先遍歷策略

  簡單理解,深度優(yōu)先遍歷策略主要是指建立一個起點,按照這個起點的順序,順序抓取鏈條上,沒有被抓取的每個節(jié)點。但有的時候,面對“無限循環(huán)”節(jié)點的時候,這一策略便顯得捉禁見肘。

  2、PR優(yōu)先策略

  RP優(yōu)先策略是一個非常注明的鏈接分析方法,它用于衡量網頁的重要性,通常它會計算一個頁面上URL的PR,按照從高到低的順序進行抓取。

  由于PR值的計算,需要不斷的迭代更新,通常這里所采用的都是非完全PageRank策略。

  3、反鏈策略

  反鏈策略,并沒有一個明確的官方文檔說明,這里蝙蝠俠IT認為,它主要是基于反鏈的數量以及種子頁面的權威度,二者進行加權評估后,按照優(yōu)先順序抓取。

  4、寬度優(yōu)先遍歷策略

  寬度優(yōu)先便利策略,是早期搜索引擎常用的一種抓取策略,主要流程是提取整個頁面中的URL,其中未被抓取的URL,就被放入待抓取列隊,以此循環(huán)。

  5、社會化媒體分享策略

  社會化媒體分析策略,主要是指一個URL在社交媒體中的流行度,它的轉載量,評論,轉發(fā)量,綜合指標的評估。

  言外之意,如果你的URL最先沒有在百度網址提交,而是出現在社交媒體中,比如:頭條文章,也是很有可能被百度抓取的。

  二、一般蜘蛛抓取的流程:

  對于搜索引擎而言,常見的抓取流程包括:種子頁URL提取->整理新的待抓取URL集合->合并更新鏈接(包括已經抓取過的鏈接)->解析頁面內容->進入鏈接總庫(索引庫)

  其中,在解析頁面內容,進入索引庫的時候,它需要經過多層復雜的系統(tǒng)計算,評估目標URL的質量,從而決定是否進入低質量庫。

  如何引蜘蛛爬行頁面?

  對于合理引導蜘蛛爬行頁面,具體常見的操作是:

  1、內容更新頻率

  理論上,如果你的頁面更新頻率相對較高,那么搜索引擎自然爬蟲就是頻繁來訪,目的是抓取更多潛在的優(yōu)質內容。

  2、網站頁面穩(wěn)定

  服務器的連通率是決定,搜索引擎蜘蛛是否能夠順利抓取的主要因素,如果你的網站經常產生延遲,識別對抓取與索引產生重要影響。

  3、內容更新質量

  言外之意,如果你長期頻繁更新低質量內容,是不可取的,特別是百度爬蟲而言,如果你定期輸出高質量且具有稀缺性的內容(獨特的視角)你會發(fā)現蜘蛛的來訪頻率很高,并且經過一定周期的信任度累積,很容易達到“秒收錄”。

  4、整站目標權重

  這是一個綜合性指標的考慮,通常而言,高權重的站點,更受搜索引擎的親睞,蜘蛛抓取的也相對頻繁,但這個評級,并不是咱們SEO專員,簡單通過站長工具查詢的結果,而是百度自身,一個非常私密的評估體系。

  以上只是針對搜索引擎蜘蛛的工作原理做了基本的框架介紹,為SEO優(yōu)化人員帶來了簡單的梳理,希望對大家的優(yōu)化工作有所幫助。

文章題目:SEO入門:搜索引擎蜘蛛的工作原理
文章起源:http://www.muchs.cn/news4/2004.html

成都網站建設公司_創(chuàng)新互聯,為您提供響應式網站、電子商務外貿網站建設、網站制作、網站策劃、Google

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

手機網站建設