搜索引擎爬取的規(guī)律

2014-03-08 分類：網(wǎng)站建設(shè)

搜索引擎的工作原理總共有四步：

第一步：爬行，搜索引擎是通過一種特定規(guī)律的軟件跟蹤網(wǎng)頁的鏈接，從一個鏈接爬到另外一個鏈接，所以稱為爬行。

第二步：抓取存儲，搜索引擎是通過蜘蛛跟蹤鏈接爬行到網(wǎng)頁，并將爬行的數(shù)據(jù)存入原始頁面數(shù)據(jù)庫。

第三步：預處理，搜索引擎將蜘蛛抓取回來的頁面，進行各種步驟的預處理。

第四步：排名，用戶在搜索框輸入關(guān)鍵詞后，排名程序調(diào)用索引庫數(shù)據(jù)，計算排名顯示給用戶，排名過程與用戶直接互動的。

網(wǎng)頁爬行規(guī)則:

1、優(yōu)質(zhì)網(wǎng)站專門分配蜘蛛爬行，及時爬行，及時收錄，及時放出供網(wǎng)民搜索；

2、普通網(wǎng)站，分配一定的蜘蛛爬行資源，爬到一定量就不爬行了；

3、遵循F型爬行規(guī)則，從左到右，從商到下的原則爬行。

提高搜索引擎蜘蛛爬取的技巧：

1、首先說域名，除了簡單易紀，使用常用后綴外，域名要選擇和網(wǎng)站主題相關(guān)。如果網(wǎng)站內(nèi)容與域名相符，會在搜索引擎的排名中有好的表現(xiàn)。如果有多個域名，要選用一個主域名，其他域名301重定向到主域名。

空間一定要穩(wěn)定，速度越快，單位時間內(nèi)蜘蛛爬的越多，越有利于排名。如果您的網(wǎng)站經(jīng)常打不開，影響用戶的體驗，也會影響Spider抓取你的網(wǎng)站，如果經(jīng)常發(fā)生，用戶的體驗降低，Spider也不會來了。會影響您網(wǎng)站的收錄，更不用說排名。

2、樹型扁平結(jié)構(gòu)
層級分明的樹狀扁平結(jié)構(gòu)是較理想的網(wǎng)站部署結(jié)構(gòu)，每個頁面與其父子頁面有鏈接關(guān)聯(lián)，可以幫助用戶快速定位到感興趣的頻道、正文，也有利于搜索引擎理解網(wǎng)站結(jié)構(gòu)層次和更好的爬取內(nèi)容。在url設(shè)置上, 目錄層級不要太深，盡量在4層以內(nèi)

3、文章標題
文章標題中要準確包含文章概要，并且包含文章的主關(guān)鍵詞。這個主關(guān)鍵詞就是你希望在搜索引擎中排名的關(guān)鍵詞。標題是極重要的內(nèi)容。大幅修改，可能會帶來大幅波動。所以請慎重對待網(wǎng)頁標題。如無必要，盡量不做大幅修改。

4、文章內(nèi)容
文章內(nèi)容要豐富,最好是原創(chuàng)內(nèi)容。另外搜索引擎不能識別flash、frame、ajax，所以文章內(nèi)容要中，要盡量少使用。如果一定要使用，可以建立文字版的索引頁。文章正文標題要使用標簽，文章配圖要加alt標簽。

當前名稱：搜索引擎爬取的規(guī)律
文章出自：http://www.muchs.cn/news19/6519.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供小程序開發(fā)、企業(yè)網(wǎng)站制作、建站公司、ChatGPT、網(wǎng)站制作、面包屑導航

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

搜索引擎是如何知道網(wǎng)站的目標關(guān)鍵詞是什么的 2014-03-08
搜索引擎對網(wǎng)頁的鏈接的評估有四種基本方法 2014-03-08
搜索引擎如何進行原創(chuàng)識別？ 2014-03-08
搜索引擎會懲罰什么樣的網(wǎng)站? 2014-03-08
搜索引擎下拉框也能實現(xiàn)網(wǎng)站的百度排名 2014-03-06
揭秘單頁網(wǎng)站seo優(yōu)化排名三大策略 2014-03-06
提高網(wǎng)站權(quán)重的5個技巧 2014-03-06
提高百度權(quán)重的站點優(yōu)化策略分析 2014-03-06