什么是"倒排索引"?

什么是"倒排索引"?網(wǎng)站建設(shè)★網(wǎng)站設(shè)計★網(wǎng)站制作★網(wǎng)頁設(shè)計-800元全包;企業(yè)網(wǎng)絡(luò)推廣☆網(wǎng)站優(yōu)化☆seo☆關(guān)鍵詞排名☆百度快照-2200元全年展示;做網(wǎng)站優(yōu)化排名-網(wǎng)站建設(shè)公司

成都創(chuàng)新互聯(lián)公司主營淅川網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,成都app開發(fā),淅川h5成都微信小程序搭建,淅川網(wǎng)站營銷推廣歡迎淅川等地區(qū)企業(yè)咨詢

什么是"倒排索引"

一、倒排索引簡介

倒排索引(英文:Inverted Index),是一種索引方法,常被用于全文檢索系統(tǒng)中的一種單詞文檔映射結(jié)構(gòu)。現(xiàn)代搜索引擎絕大多數(shù)的索引都是基于倒排索引來進(jìn)行構(gòu)建的,這源于在實際應(yīng)用當(dāng)中,用戶在使用搜索引擎查找信息時往往只輸入信息中的某個屬性關(guān)鍵字,如一些用戶不記得歌名,會輸入歌詞來查找歌名;輸入某個節(jié)目內(nèi)容片段來查找該節(jié)目等等。

面對海量的信息數(shù)據(jù),為滿足用戶需求,順應(yīng)信息時代快速獲取信息的趨勢,聰明的開發(fā)者們在進(jìn)行搜索引擎開發(fā)時對這些信息數(shù)據(jù)進(jìn)行逆向運算,研發(fā)了“關(guān)鍵詞——文檔”形式的一種映射結(jié)構(gòu),實現(xiàn)了通過物品屬性信息對物品進(jìn)行映射時,可以幫助用戶快速定位到目標(biāo)信息,從而極大降低了信息獲取難度。倒排索引又叫反向索引,它是一種逆向思維運算,是現(xiàn)代信息檢索領(lǐng)域里面最有效的一種索引結(jié)構(gòu)。

二、倒排索引概述:

在關(guān)系數(shù)據(jù)庫系統(tǒng)里,索引是檢索數(shù)據(jù)最有效率的方式,但對于搜索引擎,它并不能滿足其特殊要求:

1、海量數(shù)據(jù):搜索引擎面對的是海量數(shù)據(jù),像Google、百度這樣大型的商業(yè)搜索引擎索引都是億級甚至百億級的網(wǎng)頁數(shù)量 ,面對如此海量數(shù)據(jù) ,使得數(shù)據(jù)庫系統(tǒng)很難有效的管理。

2、數(shù)據(jù)操作簡單:搜索引擎使用的數(shù)據(jù)操作簡單 ,一般而言 ,只需要增、 刪、 改、 查幾個功能 ,而且數(shù)據(jù)都有特定的格式 ,可以針對這些應(yīng)用設(shè)計出簡單高效的應(yīng)用程序。而一般的數(shù)據(jù)庫系統(tǒng)則支持大而全的功能 ,同時損失了速度和空間。最后 搜索引擎面臨大量的用戶檢索需求 ,這要求搜索引擎在檢索程序的設(shè)計上要分秒必爭 ,盡可能的將大運算量的工作在索引建立時完成 ,使檢索運算盡量的少。一般的數(shù)據(jù)庫系統(tǒng)很難承受如此大量的用戶請求 ,而且在檢索響應(yīng)時間和檢索并發(fā)度上都不及我們專門設(shè)計的索引系統(tǒng)。

本文標(biāo)題:什么是"倒排索引"?
標(biāo)題路徑:http://www.muchs.cn/article27/dghshcj.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供標(biāo)簽優(yōu)化外貿(mào)建站、微信小程序、網(wǎng)站制作、營銷型網(wǎng)站建設(shè)、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運營