2016-11-07 分類: 網(wǎng)站建設(shè)
搜索引擎架構(gòu)可以當(dāng)作軟件架構(gòu)來理解。
① 軟件架構(gòu)
百度百科對于軟件架構(gòu)的描述如下:
軟件架構(gòu),是指一系列相關(guān)的抽象模式,用于指導(dǎo)大型軟件系統(tǒng)各個方面的設(shè)計(jì)。
② 搜索引擎架構(gòu)
那么搜索引擎的架構(gòu),就是用于指導(dǎo)搜索引擎系統(tǒng)中重要的組件以及組件之間關(guān)系而設(shè)計(jì)的抽象模式。
二、設(shè)計(jì)搜索引擎架構(gòu)的目標(biāo)是什么?
SEOer應(yīng)該知道為什么要設(shè)計(jì)搜索引擎架構(gòu),主要有以下兩點(diǎn):
① 搜索效果
搜索引擎致力于優(yōu)化用戶搜索體驗(yàn),當(dāng)用戶搜索某個詞之后,可以給予用戶更多更精準(zhǔn)的結(jié)果。這就是在質(zhì)量層面上的目標(biāo)。
② 搜索效率
搜索引擎追求更快地展現(xiàn)出用戶查詢詞的搜索結(jié)果,也是為了提升用戶搜索體驗(yàn),試想如果我們搜索一個詞,搜索引擎一分鐘后才顯示出結(jié)果,這樣的搜索引擎在這個時(shí)代是要被淘汰的。這就是在速度層面上的目標(biāo)。
小結(jié):因?yàn)橛脩粜枰粋€高效的搜索引擎系統(tǒng),對搜索引擎有效果和效率的要求,所以,結(jié)構(gòu)的目標(biāo)也就是這兩點(diǎn)了。
三、搜索引擎的基本架構(gòu)是什么?
對于SEOer而言,只需要在抽象模式上了解搜索引擎架構(gòu)即可,也無需關(guān)注過多的數(shù)學(xué)公式與算法。
搜索引擎基本架構(gòu)主要有索引處理和查詢處理。
① 索引處理
索引過程主要由以下幾個組件來完成:
1)文本采集組件
文本采集組件,主要用于發(fā)現(xiàn)、存儲和傳遞文檔。
2)文本轉(zhuǎn)換組件
文本轉(zhuǎn)換組件,主要用于提取文檔中所有內(nèi)容和元數(shù)據(jù),同時(shí)將文本轉(zhuǎn)換為索引項(xiàng)。
元數(shù)據(jù)可以理解為頁面的基本參數(shù),如類型、結(jié)構(gòu)、多少字等等。
索引項(xiàng),又可以稱之為特征,是對文檔內(nèi)容的一部分,符合要求的文檔的索引會被存放在索引表中用于搜索。
3)索引創(chuàng)建組件
索引創(chuàng)建組件,利用文本轉(zhuǎn)換組件輸出的文檔和索引項(xiàng),創(chuàng)建索引表,從而實(shí)現(xiàn)快速搜索。
索引的創(chuàng)建非常重要,尤其是針對互聯(lián)網(wǎng)的信息爆炸時(shí)代,對于新的文檔加入時(shí),應(yīng)高效完成索引創(chuàng)建。為了實(shí)現(xiàn)高效,一般都采用的倒排索引。
② 查詢處理
查詢處理主要由以下幾個組件來完成:
1)用戶交互組件
用戶交互組件,提供了用戶查詢和搜索引擎展現(xiàn)搜索結(jié)果之間的接口。
搜索引擎接收到用戶的查詢詞后,在索引庫中找到相關(guān)文檔,按照程序認(rèn)為的最合理的索引排序結(jié)果展現(xiàn)給用戶。
2)排序組件
排序組件,從用戶交互組件中獲得查詢詞,并且根據(jù)一定的模型給出一個得分從高到低排序的文檔。
排序的高效依賴于搜索引擎檢索技術(shù)的高低,排序的質(zhì)量取決于搜索引擎的檢索模式。
3)評價(jià)組件
評價(jià)組件,主要用于評測和評價(jià)搜索引擎系統(tǒng)的效果和效率的目標(biāo)。
一來可以統(tǒng)計(jì)大量搜索日志來記錄和分析用戶行為,二來評價(jià)的結(jié)果用來調(diào)整和改善排序組件的性能,從而提升用戶的搜索體驗(yàn)度。
網(wǎng)站題目:【網(wǎng)絡(luò)推廣】搜索引擎的基本架構(gòu)是什么?為什么要設(shè)計(jì)搜索引擎架構(gòu)?
分享路徑:http://muchs.cn/news/61691.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、響應(yīng)式網(wǎng)站、網(wǎng)站導(dǎo)航、網(wǎng)站維護(hù)、網(wǎng)站營銷、網(wǎng)站設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容