搜索引擎工作的基本之蜘蛛的抓取原理分析

2021-04-25    分類: 網(wǎng)站建設(shè)

上篇《搜索引擎工作的基本原理-蜘蛛的爬行》中我們詳細介紹了蜘蛛是如何爬行工作的,現(xiàn)在小編想跟大家聊一下蜘蛛的抓取。

??圖二.jpg

理論上,蜘蛛的爬行可以遍布整個互聯(lián)網(wǎng)的全部頁面,但是實際上,蜘蛛做不到這些,也不需要去做到,因為整個互聯(lián)網(wǎng)每天出現(xiàn)的新頁面是以萬億級計數(shù)的,其中有大量的垃圾內(nèi)容,這里所指的垃圾是指垃圾網(wǎng)站出現(xiàn)大量無關(guān)內(nèi)容,例如相親網(wǎng)上出現(xiàn)違規(guī)的信息,出現(xiàn)一兩次還可以忍受,出現(xiàn)次數(shù)多了會對搜索引擎用戶體驗造成很大的傷害,嚴重的影響搜索引擎的盈利。

既然知道了蜘蛛爬行并不會爬行和抓取所有的頁面,我們?yōu)榱烁囗撁姹皇珍?,就要學著討好蜘蛛,蜘蛛的使命就是盡量抓取重要頁面。我們就在這方面討好它,凡是方便利于蜘蛛爬行和抓取的行為都是好行為。

??圖一.jpg

蜘蛛的抓取一般喜歡以下幾種行為:

蜘蛛喜歡的行為一:網(wǎng)站和頁面的權(quán)重盡可能的高,蜘蛛抓取的過程中首先考慮這種網(wǎng)站,因為在蜘蛛看來,質(zhì)量高、建站時間長的網(wǎng)站才會有比較高的權(quán)重。高權(quán)重的網(wǎng)站甚至可以達到秒收錄的效果。

蜘蛛喜歡的行為二:頁面更新頻率要高,如果不經(jīng)常更新頁面,蜘蛛也就沒必要經(jīng)常過來抓取頁面內(nèi)容了,只有我們經(jīng)常更新,蜘蛛才會更加頻繁的光顧我們的網(wǎng)站網(wǎng)頁內(nèi)容。所以網(wǎng)站維護期最好做到每日更新,不僅是原創(chuàng)內(nèi)容,也可以轉(zhuǎn)載一些時效性強的資訊。

蜘蛛喜歡的行為三:高質(zhì)量的內(nèi)外鏈建設(shè),高質(zhì)量的內(nèi)外鏈建設(shè)能使得蜘蛛的爬行深度增加,要被蜘蛛抓取,就必須有導入鏈接進頁面,否則蜘蛛根本就爬行不到該頁面,更不要說抓取以及收錄了。這里就是高質(zhì)量內(nèi)外鏈的重要性的體現(xiàn)了,這也是人們常說的“內(nèi)容為王,外鏈為后”這句話的依據(jù)。蜘蛛的爬行時沿著鏈接爬行的,如果有高質(zhì)量的外部鏈接,蜘蛛爬行的深度會加深,很可能多爬幾層,讓我們的頁面更多的被蜘蛛抓取。

蜘蛛喜歡的行為四:距離首頁點擊距離。這里說的距離首頁點擊距離一般是因為首頁的權(quán)重高,蜘蛛爬行到首頁次數(shù)也最多,每通過一次鏈接叫一次點擊,距離首頁點擊距離越近代表了頁面權(quán)越重高,蜘蛛就喜歡這些短距離高權(quán)重的頁面。頁面權(quán)重還可以通過URL結(jié)構(gòu)來直觀體現(xiàn),URL結(jié)構(gòu)短、層次淺代表的頁面權(quán)重就相對高。

通過了解搜索引擎工作的基本原理-蜘蛛的抓取,就應該明白搜索引擎蜘蛛喜歡什么樣的網(wǎng)站,這也就是我們SEO工作人員努力的目標。

當前名稱:搜索引擎工作的基本之蜘蛛的抓取原理分析
分享URL:http://www.muchs.cn/news14/110264.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)頁設(shè)計公司、小程序開發(fā)、建站公司、云服務器App設(shè)計、品牌網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

手機網(wǎng)站建設(shè)