【網(wǎng)絡(luò)推廣】搜索引擎的基本架構(gòu)是什么?為什么要設(shè)計搜索引擎架構(gòu)?

2016-11-07    分類: 網(wǎng)站建設(shè)

一、什么是搜索引擎的架構(gòu)?

搜索引擎架構(gòu)可以當(dāng)作軟件架構(gòu)來理解。

① 軟件架構(gòu)

百度百科對于軟件架構(gòu)的描述如下:

軟件架構(gòu),是指一系列相關(guān)的抽象模式,用于指導(dǎo)大型軟件系統(tǒng)各個方面的設(shè)計。

② 搜索引擎架構(gòu)

那么搜索引擎的架構(gòu),就是用于指導(dǎo)搜索引擎系統(tǒng)中重要的組件以及組件之間關(guān)系而設(shè)計的抽象模式。

二、設(shè)計搜索引擎架構(gòu)的目標(biāo)是什么?

SEOer應(yīng)該知道為什么要設(shè)計搜索引擎架構(gòu),主要有以下兩點:

① 搜索效果

搜索引擎致力于優(yōu)化用戶搜索體驗,當(dāng)用戶搜索某個詞之后,可以給予用戶更多更精準(zhǔn)的結(jié)果。這就是在質(zhì)量層面上的目標(biāo)。

② 搜索效率

搜索引擎追求更快地展現(xiàn)出用戶查詢詞的搜索結(jié)果,也是為了提升用戶搜索體驗,試想如果我們搜索一個詞,搜索引擎一分鐘后才顯示出結(jié)果,這樣的搜索引擎在這個時代是要被淘汰的。這就是在速度層面上的目標(biāo)。

小結(jié):因為用戶需要一個高效的搜索引擎系統(tǒng),對搜索引擎有效果和效率的要求,所以,結(jié)構(gòu)的目標(biāo)也就是這兩點了。

三、搜索引擎的基本架構(gòu)是什么?

對于SEOer而言,只需要在抽象模式上了解搜索引擎架構(gòu)即可,也無需關(guān)注過多的數(shù)學(xué)公式與算法。

搜索引擎基本架構(gòu)主要有索引處理和查詢處理。

① 索引處理


索引過程主要由以下幾個組件來完成:

1)文本采集組件

文本采集組件,主要用于發(fā)現(xiàn)、存儲和傳遞文檔。

2)文本轉(zhuǎn)換組件

文本轉(zhuǎn)換組件,主要用于提取文檔中所有內(nèi)容和元數(shù)據(jù),同時將文本轉(zhuǎn)換為索引項。

元數(shù)據(jù)可以理解為頁面的基本參數(shù),如類型、結(jié)構(gòu)、多少字等等。

索引項,又可以稱之為特征,是對文檔內(nèi)容的一部分,符合要求的文檔的索引會被存放在索引表中用于搜索。

3)索引創(chuàng)建組件

索引創(chuàng)建組件,利用文本轉(zhuǎn)換組件輸出的文檔和索引項,創(chuàng)建索引表,從而實現(xiàn)快速搜索。

索引的創(chuàng)建非常重要,尤其是針對互聯(lián)網(wǎng)的信息爆炸時代,對于新的文檔加入時,應(yīng)高效完成索引創(chuàng)建。為了實現(xiàn)高效,一般都采用的倒排索引。

② 查詢處理


查詢處理主要由以下幾個組件來完成:

1)用戶交互組件

用戶交互組件,提供了用戶查詢和搜索引擎展現(xiàn)搜索結(jié)果之間的接口。

搜索引擎接收到用戶的查詢詞后,在索引庫中找到相關(guān)文檔,按照程序認(rèn)為的最合理的索引排序結(jié)果展現(xiàn)給用戶。

2)排序組件

排序組件,從用戶交互組件中獲得查詢詞,并且根據(jù)一定的模型給出一個得分從高到低排序的文檔。

排序的高效依賴于搜索引擎檢索技術(shù)的高低,排序的質(zhì)量取決于搜索引擎的檢索模式。

3)評價組件

評價組件,主要用于評測和評價搜索引擎系統(tǒng)的效果和效率的目標(biāo)。

一來可以統(tǒng)計大量搜索日志來記錄和分析用戶行為,二來評價的結(jié)果用來調(diào)整和改善排序組件的性能,從而提升用戶的搜索體驗度。

分享名稱:【網(wǎng)絡(luò)推廣】搜索引擎的基本架構(gòu)是什么?為什么要設(shè)計搜索引擎架構(gòu)?
文章起源:http://www.muchs.cn/news41/61691.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供關(guān)鍵詞優(yōu)化軟件開發(fā)、搜索引擎優(yōu)化網(wǎng)頁設(shè)計公司、營銷型網(wǎng)站建設(shè)、外貿(mào)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化

網(wǎng)站建設(shè)知識