做seo搜索引擎工作原理你要知

2014-02-09    分類(lèi): 網(wǎng)站建設(shè)

很多專(zhuān)業(yè)的seo技術(shù)人員都說(shuō),如果想要學(xué)習(xí)seo,首先你得知道搜索引擎的工作原理,其原因就是,知道搜索引擎原理,才能從實(shí)質(zhì)出發(fā),學(xué)習(xí)seo工作原理,首先我們得從這三部分下手,第一是,爬行和抓?。核阉饕嬷┲胪ㄟ^(guò)跟蹤鏈接發(fā)現(xiàn)和訪問(wèn)網(wǎng)頁(yè),然后去讀取頁(yè)面中的HTML代碼,存入到數(shù)據(jù)庫(kù)里面。第二是,預(yù)處理:索引程序?qū)δ切┳ト?lái)的頁(yè)面進(jìn)行文字的提取、中文分詞、索引、倒排索引等處理,這是用來(lái)排名程序的調(diào)用問(wèn)題。第三是,排名:這也是大家最關(guān)心的,當(dāng)用戶輸入關(guān)鍵詞后,排名程序調(diào)用索引數(shù)據(jù),計(jì)算相關(guān)性,然后按一定的格式生成搜索結(jié)果頁(yè)面也就是關(guān)鍵詞的排名。以下是具體的介紹,一起來(lái)了解一下。

第一、蜘蛛爬行和處理

百度蜘蛛程序會(huì)發(fā)出頁(yè)面訪問(wèn)請(qǐng)求,這個(gè)時(shí)候服務(wù)器就會(huì)返回HTML代碼,這個(gè)時(shí)候,蜘蛛程序就會(huì)把收到的代碼存入到原始的頁(yè)面數(shù)據(jù)庫(kù),而且搜索引擎未來(lái)提高爬行的速度,會(huì)使用多個(gè)蜘蛛進(jìn)行分布爬行,當(dāng)爬到網(wǎng)站的時(shí)候,第一件事是需要訪問(wèn)robots.txt協(xié)議,看哪些允許抓取,哪些不允許抓取,蜘蛛是會(huì)遵守協(xié)議的,對(duì)于蜘蛛抓取是有兩種抓取形式的,一種是深度的抓取、另一種是廣度優(yōu)先抓取策略。但是百度蜘蛛抓取的網(wǎng)頁(yè)太多所以并不是每一個(gè)都可以抓取到,那么這個(gè)時(shí)候我們就需要去吸引蜘蛛來(lái)抓取我們的網(wǎng)頁(yè),那么有哪些方法呢?

做seo搜索引擎工作原理你要知

1、網(wǎng)站域名比較久,這樣的域名網(wǎng)站蜘蛛會(huì)認(rèn)為是質(zhì)量高、資質(zhì)老的網(wǎng)站,所以會(huì)優(yōu)先深度去抓取內(nèi)容。

2、網(wǎng)頁(yè)的更新頻率,這樣的網(wǎng)站會(huì)根據(jù)網(wǎng)站每天生成的內(nèi)容進(jìn)行數(shù)據(jù)統(tǒng)計(jì),然后發(fā)現(xiàn)每次都有新內(nèi)容產(chǎn)出,那么就會(huì)經(jīng)常去抓取。

3、導(dǎo)入鏈接。

4、URL結(jié)構(gòu)等等。

第二、預(yù)處理

預(yù)處理在seo技術(shù)中也叫“索引”這是因?yàn)樗饕穷A(yù)處理最主要的內(nèi)容,前面說(shuō)了蜘蛛抓取了網(wǎng)頁(yè)的內(nèi)容,那么這個(gè)時(shí)候就需要對(duì)內(nèi)容去進(jìn)行處理,因?yàn)獒槍?duì)于這個(gè)關(guān)鍵詞有很多競(jìng)爭(zhēng)對(duì)手,這時(shí)候需要選出最符合要求的內(nèi)容來(lái)展示在最前面,這里主要就有提取內(nèi)容的文字,中文分詞,去停止詞,消除噪聲,去重正向索引和倒排索引,鏈接計(jì)算,質(zhì)量判斷這些工作去有價(jià)值的內(nèi)容刷選。

第三、網(wǎng)站關(guān)鍵詞排名

經(jīng)過(guò)了前面兩項(xiàng)的重重選擇就開(kāi)始對(duì)關(guān)鍵詞進(jìn)行排名了,這里的排名會(huì)經(jīng)過(guò)一個(gè)關(guān)鍵詞在網(wǎng)站的一個(gè)詞頻及密度,來(lái)體現(xiàn)關(guān)鍵詞在網(wǎng)站的一個(gè)重要性,同時(shí)還會(huì)計(jì)算出相關(guān)性,接著就會(huì)進(jìn)行過(guò)濾這個(gè)過(guò)濾是對(duì)于那些網(wǎng)站有作弊嫌疑的網(wǎng)站做的懲罰,最后就會(huì)確定好網(wǎng)站關(guān)鍵詞排名,排名程序會(huì)調(diào)用原始頁(yè)面的標(biāo)題標(biāo)簽、說(shuō)明標(biāo)簽、快照日期等數(shù)據(jù)據(jù)顯示在頁(yè)面上面。

不知道看到這里,大家對(duì)于搜素引擎的原理知道多少,在做網(wǎng)站優(yōu)化排名的時(shí)候,千萬(wàn)不能操之過(guò)急,首先需要考慮到搜索引擎的工作原理,才能避免一些不必要的錯(cuò)誤,在每一點(diǎn)上去規(guī)范優(yōu)化操作技術(shù)。

當(dāng)前題目:做seo搜索引擎工作原理你要知
文章網(wǎng)址:http://muchs.cn/news41/5991.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、網(wǎng)站營(yíng)銷(xiāo)商城網(wǎng)站、網(wǎng)頁(yè)設(shè)計(jì)公司、全網(wǎng)營(yíng)銷(xiāo)推廣、手機(jī)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化