搜索引擎的發(fā)展歷史和現(xiàn)狀分析

2024-01-29    分類(lèi): 網(wǎng)站建設(shè)

搜索引擎的發(fā)展歷史
搜索引擎的起源:
1990年,加拿大麥吉爾大學(xué)(University of McGill)計(jì)算機(jī)學(xué)院的師生(Alan Emtage、Peter Deutsch、Bill Wheelan)開(kāi)發(fā)出Archie(Archie FAQ).當(dāng)時(shí),萬(wàn)維網(wǎng)(World Wide Web)還沒(méi)有出現(xiàn),人們通過(guò)FTP來(lái)共享交流資源.Alan Emtage等想到了開(kāi)發(fā)一個(gè)可以用文件名查找文件的系統(tǒng),于是便有了Archie.Archie是第一個(gè)自動(dòng)索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站文件的程序,能定期搜集并分析FTP服務(wù)器上的文件名信息,提供查找分別在各個(gè)FTP主機(jī)中的文件,但它還不是真正的搜索引擎,Archie用戶(hù)必須輸入精確的文件名進(jìn)行搜索,Archie告訴用戶(hù)哪個(gè)FTP服務(wù)器能下載該文件.雖然Archie搜集的信息資源不是網(wǎng)頁(yè)(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動(dòng)搜集信息資源、建立索引、提供檢索服務(wù).所以,Archie被公認(rèn)為現(xiàn)代搜索引擎的鼻祖.
由于A(yíng)rchie深受歡迎,受其啟發(fā),Nevada System Computing Services大學(xué)于1993年開(kāi)發(fā)了一個(gè)Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ).Jughead是后來(lái)另一個(gè)Gopher搜索工具.

Spider的出現(xiàn)
當(dāng)“蜘蛛”程序出現(xiàn)時(shí),現(xiàn)代意義上的搜索引擎才初露端倪.它實(shí)際上是一種電腦“機(jī)器人”(Computer Robot),由于專(zhuān)門(mén)用于檢索信息的“機(jī)器人”程序就象蜘蛛一樣在網(wǎng)絡(luò)間爬來(lái)爬去,反反復(fù)復(fù),不知疲倦.所以,搜索引擎的“機(jī)器人”程序就被稱(chēng)為“蜘蛛”程序.現(xiàn)在主流定義的[搜索引擎的工作原理] ,無(wú)不把spider放在相當(dāng)重要的位置.
這種程序?qū)嶋H是利用html文檔之間的鏈接關(guān)系,在Web上一個(gè)網(wǎng)頁(yè)一個(gè)網(wǎng)頁(yè)的爬?。╟rawl),將這些網(wǎng)頁(yè)抓到系統(tǒng)來(lái)進(jìn)行分析,并放入數(shù)據(jù)庫(kù)中.第一個(gè)開(kāi)發(fā)出“蜘蛛”程序的是Matthew Gray,他于1993年開(kāi)發(fā)了World Wide Web Wanderer,它最初建立時(shí)是為了統(tǒng)計(jì)互聯(lián)網(wǎng)上的服務(wù)器數(shù)量,到后來(lái)發(fā)展到能夠捕獲網(wǎng)址.現(xiàn)代搜索引擎的思路就來(lái)源于Wanderer,后來(lái)很多人在此基礎(chǔ)上對(duì)蜘蛛程序進(jìn)行了改進(jìn).
1994年7月20日發(fā)布的Lycos網(wǎng)站第一個(gè)將 “蜘蛛”程序接入到其索引程序中.引入“蜘蛛”后給其帶來(lái)的大優(yōu)勢(shì)就在于其遠(yuǎn)勝于其它搜索引擎的數(shù)據(jù)量.自此之后幾乎所有占據(jù)主導(dǎo)地位的搜索引擎中,都靠“蜘蛛”來(lái)搜集網(wǎng)頁(yè)信息.
1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier創(chuàng)立了Inktomi,1996年5月20日,Inktomi公司成立,強(qiáng)大的HotBot出現(xiàn)在世人面前.聲稱(chēng)每天能抓取索引1千萬(wàn)頁(yè)以上,所以有遠(yuǎn)超過(guò)其它搜索引擎的新內(nèi)容.HotBot也大量運(yùn)用cookie儲(chǔ)存用戶(hù)的個(gè)人搜索喜好設(shè)置.

可搜索目錄
1994年4月,斯坦福大學(xué)的兩名博士生,美籍華人楊致遠(yuǎn)和David Filo共同創(chuàng)辦了Yahoo!.隨著訪(fǎng)問(wèn)量和收錄鏈接數(shù)的增長(zhǎng),Yahoo目錄開(kāi)始支持簡(jiǎn)單的數(shù)據(jù)庫(kù)搜索.Yahoo!中收錄的網(wǎng)站,因?yàn)槎几接泻?jiǎn)介信息,所以搜索效率明顯提高.
1996年8月,sohu公司成立,制作中文網(wǎng)站分類(lèi)目錄,曾有“出門(mén)找地圖,上網(wǎng)找搜狐”的美譽(yù).
他們因?yàn)閿?shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實(shí)上只是一個(gè)可搜索的目錄.隨著互聯(lián)網(wǎng)網(wǎng)站的急劇增加,這種人工編輯的分類(lèi)目錄已經(jīng)不適應(yīng).
1997年8月,Northernlight搜索引擎正式現(xiàn)身.它曾是擁有大數(shù)據(jù)庫(kù)的搜索引擎之一,它沒(méi)有Stop Words,它有出色的Current News、7100多出版物組成的Special Collection、良好的高級(jí)搜索語(yǔ)法,第一個(gè)支持對(duì)搜索結(jié)果進(jìn)行簡(jiǎn)單的自動(dòng)分類(lèi).

元搜索引擎
1995年,一種新的搜索引擎形式出現(xiàn)了——元搜索引擎(Meta Search Engine).用戶(hù)只需提交一次搜索請(qǐng)求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個(gè)預(yù)先選定的獨(dú)立搜索引擎,并將從各獨(dú)立搜索引擎返回的所有查詢(xún)結(jié)果,集中起來(lái)處理后再返回給用戶(hù).
第一個(gè)元搜索引擎,是Washington大學(xué)碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler.元搜索引擎概念上好聽(tīng),但搜索效果始終不理想,所以沒(méi)有哪個(gè)元搜索引擎有過(guò)強(qiáng)勢(shì)地位.

實(shí)現(xiàn)高級(jí)搜索語(yǔ)法
1995年12月,DEC的正式發(fā)布AltaVista.AltaVista是第一個(gè)支持自然語(yǔ)言搜索的搜索引擎,第一個(gè)實(shí)現(xiàn)高級(jí)搜索語(yǔ)法的搜索引擎(如AND、 OR、 NOT等).用戶(hù)可以用AltaVista搜索新聞組(Newsgroups)的內(nèi)容并從互聯(lián)網(wǎng)上獲得文章,還可以搜索圖片名稱(chēng)中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects.AltaVista也聲稱(chēng)是第一個(gè)支持用戶(hù)自己向網(wǎng)頁(yè)索引庫(kù)提交或刪除URL的搜索引擎,并能在24小時(shí)內(nèi)上線(xiàn).AltaVista最有趣的新功能之一,是搜索有鏈接指向某個(gè)URL的所有網(wǎng)站.在面向用戶(hù)的界面上,AltaVista也作了大量革新.它在搜索框區(qū)域下放了“tips”以幫助用戶(hù)更好的表達(dá)搜索式,這些小tip經(jīng)常更新,這樣,在搜索過(guò)幾次以后,用戶(hù)會(huì)看到很多他們可能從來(lái)不知道的的有趣功能.這系列功能,逐漸被其它搜索引擎廣泛采用.1997年,AltaVista發(fā)布了一個(gè)圖形演示系統(tǒng)LiveTopics,幫助用戶(hù)從成千上萬(wàn)的搜索結(jié)果中找到想要的.

智能檢索的產(chǎn)生:
它利用分詞詞典、同義詞典,同音詞典改善檢索效果,進(jìn)一步還可在知識(shí)層面或者說(shuō)概念層面上輔助查詢(xún),通過(guò)主題詞典、上下位詞典、相關(guān)同級(jí)詞典檢索處理形成一個(gè)知識(shí)體系或概念網(wǎng)絡(luò),給予用戶(hù)智能知識(shí)提示,最終幫助用戶(hù)獲得最佳的檢索效果.
1998年10月之前,Google只是斯坦福大學(xué)(Stanford University)的一個(gè)小項(xiàng)目BackRub.1995年博士生Larry Page開(kāi)始學(xué)習(xí)搜索引擎設(shè)計(jì),于1997年9月15日注冊(cè)了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開(kāi)始提供Demo.1999年2月,Google完成了從Alpha版到Beta版的蛻變.Google公司則把1998年9月27日認(rèn)作自己的生日.Google以網(wǎng)頁(yè)級(jí)別(Pagerank)為基礎(chǔ),判斷網(wǎng)頁(yè)的重要性,使得搜索結(jié)果的相關(guān)性大大增強(qiáng).Google公司的奇客(Geek)文化氛圍、不作惡(Don’t be evil)的理念,為Google贏(yíng)得了極高的口碑和品牌美譽(yù).2006年4月,Google宣布其中文名稱(chēng)“谷歌”,這是Google第一個(gè)在非英語(yǔ)國(guó)家起的名字.
2000年1月,兩位北大校友,超鏈分析專(zhuān)利發(fā)明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士后)在成都中關(guān)村創(chuàng)立了百度(Baidu)公司.2001年8月發(fā)布Baidu.com搜索引擎Beta版(此前Baidu只為其它門(mén)戶(hù)網(wǎng)站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式發(fā)布Baidu搜索引擎,專(zhuān)注于中文搜索.Baidu搜索引擎的其它特色包括:百度快照、網(wǎng)頁(yè)預(yù)覽/預(yù)覽全部網(wǎng)頁(yè)、相關(guān)搜索詞、錯(cuò)別字糾正提示等.2002年3月閃電計(jì)劃(Blitzen Project)開(kāi)始后,技術(shù)升級(jí)明顯加快.后推出貼吧、知道、地圖、國(guó)學(xué)、百科、文檔、視頻、博客等一系列產(chǎn)品,深受網(wǎng)民歡迎.2005年8月5日在納斯達(dá)克上市,發(fā)行價(jià)為USD 27.00,代號(hào)為BIDU.開(kāi)盤(pán)價(jià)USD 66.00,以USD 122.54收盤(pán),漲幅353.85%,創(chuàng)下了5年以來(lái)美國(guó)股市上市新股當(dāng)日漲幅最高紀(jì)錄.

個(gè)性化趨勢(shì)
個(gè)性化搜索是搜索引擎的一個(gè)未來(lái)發(fā)展的重要特征和必然趨勢(shì)之一:一種通過(guò)搜索引擎的社區(qū)化產(chǎn)品(即對(duì)注冊(cè)用戶(hù)提供服務(wù))的方式來(lái)組織個(gè)人信息,然后在搜索引擎基礎(chǔ)信息庫(kù)的檢索中引入個(gè)人因素進(jìn)行分析,獲得針對(duì)個(gè)人不同的搜索結(jié)果.自2004年10月yahoo推出myweb測(cè)試版,到11月a9推出個(gè)性化功能,到2005年Google search history基本上都沿著一條路子走,分析特定用戶(hù)的搜索需求限定的范圍,然后按照用戶(hù)需求范圍擴(kuò)展到互聯(lián)網(wǎng)上其他的同類(lèi)網(wǎng)站給出最相關(guān)的結(jié)果.另外一種是針對(duì)大眾化的,Google個(gè)性化搜索引擎,或者yahooMindSet,或者我們都知道的前臺(tái)聚類(lèi)的vivisimo

網(wǎng)站名稱(chēng):搜索引擎的發(fā)展歷史和現(xiàn)狀分析
當(dāng)前地址:http://muchs.cn/news8/316108.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開(kāi)發(fā)企業(yè)網(wǎng)站制作、商城網(wǎng)站、、自適應(yīng)網(wǎng)站品牌網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站