搜索引擎為何找不到網(wǎng)上存在的內(nèi)容

2023-02-20    分類: 網(wǎng)站建設(shè)

搜索引擎為何找不到網(wǎng)上存在的內(nèi)容
網(wǎng)上的信息浩如煙海,為了在最短的時間內(nèi)找到所需的資料,我們都會借助搜索引擎來幫忙。目前各大搜索引擎都正在不斷改進搜索技術(shù)和拓展搜索功能,從而讓我們使用更加容易和方便。盡管如此,我們還是經(jīng)常發(fā)現(xiàn)有些內(nèi)容,網(wǎng)上明明存在,但是你用搜索引擎卻搜不到(其中也包括這樣的情況:雖然得到的搜索結(jié)果不少,但并不是所要的資料)。究竟是什么原因造成這種情況?

原因一:選用了不當?shù)乃阉饕孢M行搜索

要快速檢索到有用的結(jié)果,選用合適的搜索引擎不但可以讓你事半功倍,而且還可以讓你少走彎路。當前的社會分工變得越來越精細,就連搜索引擎也毫不例外,各類專業(yè)和特殊的搜索引擎正不斷應運而生,任何一個搜索引擎也不能面面俱到,即使是號稱無所不能的Google也會有束手無策的時候。但現(xiàn)在不少朋友都有這樣的問題,就是完全不理會搜索的內(nèi)容如何就喜歡直接用Google搜索,真的把它當作萬能的“仙藥”,這樣碰壁的機會自然就增多了??梢赃@樣說, Google本身也在不斷成長和改進,因為它在不少領(lǐng)域也是無能為力的。

對策:首先,我們要對將要搜索的內(nèi)容作出合理評估??纯此阉鞯男畔⑹欠癖容^冷僻,是否需要使用專用的搜索引擎?當使用流行的搜索引擎不能查找合適的資料時,考慮當前的搜索引擎是否適用,是否需要轉(zhuǎn)用其它搜索引擎再嘗試。另外,平時也要多了解搜索引擎的動態(tài)并做好收集和整理工作,這樣使用起來才能得心應手。

原因二:錯誤使用搜索關(guān)鍵字

使用正確的關(guān)鍵字就等于搜索成功了一半。這里提到錯誤使用搜索關(guān)鍵字有兩重意思:其一是沒有充分理解和領(lǐng)會所要搜索的內(nèi)容,以致錯誤使用關(guān)鍵字,例如新年到處都有人說“龍馬精神”,但龍馬是什么意思呢?如果不經(jīng)思考,直接在Google中(本文除特別說明外,所介紹的使用方法以Google作為搜索引擎,下同)直接使用“龍馬 是什么意思”作為搜索關(guān)鍵字,則會得到毫無意義的結(jié)果,但只要想想,這個問題似乎應該與一些典故有關(guān),再用“春節(jié)龍馬 出自”進行搜索,則第一結(jié)果就是答案了;其二是使用了錯別字。如果你所使用的關(guān)鍵字中含有錯別字當然就不能準確找到想要的結(jié)果了。同樣,如果網(wǎng)頁作者使用了錯別字,但你使用正確的拼寫方法進行搜索也無法得到令人滿意的結(jié)果。

對策:首先,要養(yǎng)成思考的習慣,學習分析問題,看看所要搜索的內(nèi)容與哪方面的聯(lián)系比較大,然后再決定使用關(guān)鍵字。至于錯別字的問題,盡管沒有特別有效的辦法,但也可以嘗試查字典、思考使用習慣來推測常用拼寫方法來對付。如果每當你覺得某種內(nèi)容網(wǎng)上應該有不少、卻搜索不到結(jié)果時,你應該先查一下是否有錯別字。

原因三:沒有正確分詞

就算搜索引擎的搜索技術(shù)多么先進,但它始終是程序,不會領(lǐng)會你的意圖,只是很機械地從數(shù)據(jù)庫中檢索你查詢的資料。所以當輸入一些類似“北京到重慶列車時刻表”的搜索關(guān)鍵字是不會找到結(jié)果,因為搜索引擎的數(shù)據(jù)庫中沒有這樣的關(guān)鍵詞,這就需要我們進行合理的分詞。眾所周知,我們所使用的中文文本是沒有類似英文空格之類的顯式表示詞的邊界標志,這就出現(xiàn)這樣的現(xiàn)象:把一個關(guān)鍵詞按不同的方法進行拆分得到的結(jié)果,其差異是比較大的。

對策:不要想要什么就直接輸入什么,更不要用你心中想的大白話去搜索。如果搜索關(guān)鍵詞較長,應該適當用空格進行分詞。

原因四:技術(shù)原因搜索引擎無法抓取

大部分搜索引擎是通過一種被稱為Spider的搜索機器人在網(wǎng)絡(luò)上抓取內(nèi)容,整理后放入搜索引擎庫的。當遇到由大量flash、script、asp等網(wǎng)絡(luò)語言編寫的網(wǎng)頁時(BBS、數(shù)據(jù)庫多數(shù)采用這種編寫方式),搜索機器人就會停止抓取網(wǎng)頁,因為這是為了避免一種叫“搜索機器人陷阱”(spider traps)的腳本錯誤(這種錯誤會讓搜索機器人進行無限循環(huán)的抓取,無法退出而浪費大量時間)。如果碰巧你要搜索的網(wǎng)頁是由上述網(wǎng)絡(luò)語言編寫,則會無功而返。

對策:一般情況下,這些網(wǎng)站都會提供站內(nèi)搜索服務,可以嘗試直接登錄再進行搜索。

原因五:因為其他原因不去抓取

如果你所要搜索的是一些有商業(yè)價值的內(nèi)容,即使搜索引擎可以抓取,但基于商業(yè)利益原因則可能放棄抓取。另外一種情況就是需要用戶名和密碼登錄才能訪問的站點,搜索機器人無法自動完成“輸入內(nèi)容”,所以它也沒辦法訪問(當然也有出于版權(quán)和隱私方面的因素)。

對策:碰到搜索無結(jié)果時,你先看看是否屬于上述情況,然后作出決擇。

原因六:使用了停用詞

可能不少朋友在搜索時都沒有注意到一個問題,這就是停用詞的使用。所謂的停用詞是指由于該關(guān)鍵字太常見、使用太頻繁,以至于無法搜索出有意義的結(jié)果,當你把停用詞輸入搜索框時,搜索引擎自動會忽略這些詞。各個搜索引擎對停用詞都有各自不同的定義,但一般常見多是語言中的副詞、連詞、介詞,例如“是”、 “的”等等。

對策:如果發(fā)現(xiàn)出現(xiàn)的搜索結(jié)果中并沒有完全包含所輸入的全部關(guān)鍵字,則要看看是否使用了停用詞。萬一必須使用停用詞,請用英文輸入雙引號(千萬不要輸入中文的“”符號)或“+”號把停用詞與其他關(guān)鍵字連接起來再搜索。

原因七:搜索引擎庫里的資料還沒有更新

每個搜索引擎都會定期通過搜索機器人來抓取網(wǎng)頁,這個時間不但各搜索引擎并不相同,即使是同一搜索引擎的不同鏡像站點更新時間也有一定的差異,有些周期短,有些周期長。如果碰巧所搜索的內(nèi)容,搜索引擎還沒有來得及更新,則會出現(xiàn)一個時間上的斷檔而造成無法找到結(jié)果。

對策:盡量選用更新時間快的鏡像站點來進行搜索,至于如何知道鏡像站點的更新快慢,除了自己在使用中積累經(jīng)驗外,還可以從一些專業(yè)搜索知識中得知。如果要搜索的內(nèi)容是屬于時效性比較強的,則考慮使用更新時間較快的專業(yè)搜索引擎,例如搜索時事新聞可采用新浪、BBC的新聞搜索。

網(wǎng)頁標題:搜索引擎為何找不到網(wǎng)上存在的內(nèi)容
標題路徑:http://www.muchs.cn/news41/238491.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務、企業(yè)網(wǎng)站制作、靜態(tài)網(wǎng)站、企業(yè)建站、關(guān)鍵詞優(yōu)化、網(wǎng)站排名

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護公司