相關(guān)搜索的兩種實(shí)現(xiàn)方式

2021-11-06    分類(lèi): 網(wǎng)站建設(shè)

相關(guān)搜索,想必大家都不會(huì)陌生,尤其是對(duì)SEO、PM乃至各位文案編輯妹子來(lái)說(shuō),從中皆可以看到蠻多的有價(jià)值的訊息。只是,你知道給定的用戶(hù)查詢(xún),搜索引擎是怎么計(jì)算出相關(guān)搜索的嗎一般來(lái)說(shuō),有兩種方法:


1、基于查詢(xún)會(huì)話(huà)的方法

大家都知道,搜索引擎會(huì)統(tǒng)計(jì)分析用戶(hù)的搜索行為,將此轉(zhuǎn)化為查詢(xún)會(huì)話(huà)。然后通過(guò)各種數(shù)據(jù)挖掘算法來(lái)對(duì)查詢(xún)會(huì)話(huà)進(jìn)行統(tǒng)計(jì)處理,如果一個(gè)查詢(xún)?cè)~a和查詢(xún)?cè)~b經(jīng)常一起出現(xiàn),那么自然,我們可以認(rèn)為兩者是相互關(guān)聯(lián)且值得推薦的。當(dāng)然,這樣做也會(huì)有兩個(gè)很明顯的問(wèn)題暴漏了出來(lái),用戶(hù)的一次連續(xù)的查詢(xún)可能不是針對(duì)的同一個(gè)主題,這樣,在對(duì)用戶(hù)的兩次查詢(xún)進(jìn)行拆分時(shí),很難精準(zhǔn)的進(jìn)行切割。同時(shí),該方法是以單個(gè)用戶(hù)的查詢(xún)會(huì)話(huà)作為基礎(chǔ)來(lái)統(tǒng)計(jì)的,所以在對(duì)數(shù)據(jù)進(jìn)行挖掘時(shí)不能體現(xiàn)不同用戶(hù)查詢(xún)之間的關(guān)聯(lián)。


2、基于點(diǎn)擊圖的方法

當(dāng)然,在用戶(hù)的搜索日志中,除了簡(jiǎn)單的查詢(xún)之外,還有對(duì)站點(diǎn)的點(diǎn)擊數(shù)據(jù)。如果能將此利用起來(lái),也不失為一種很好的查詢(xún)相關(guān)搜索的方法。一個(gè)簡(jiǎn)單的邏輯為:用戶(hù)查詢(xún)了關(guān)鍵詞p,然后點(diǎn)擊了網(wǎng)址D1和D2分別6次和8次,那么此時(shí)我們就可以針對(duì)p建立起一個(gè)向量[0,6,8,0],針對(duì)另一個(gè)查詢(xún)?cè)~q同樣可以建立起對(duì)應(yīng)的向量。OK,這就再次回到了根據(jù)空間向量計(jì)算相似度的模型中。既定相似度大于某個(gè)值,則這兩種搜索即為相關(guān)。當(dāng)然,如果需要做的嚴(yán)謹(jǐn)一些,就需要將被點(diǎn)擊的內(nèi)容之間的相似度計(jì)算考慮在內(nèi)。因?yàn)椴煌逆溄拥刂穼?duì)應(yīng)相同或相似內(nèi)容的現(xiàn)象在搜索引擎中屢見(jiàn)不鮮。額,細(xì)心的盆友們也發(fā)現(xiàn)了,這個(gè)計(jì)算量,還是蠻驚人的……

當(dāng)前文章:相關(guān)搜索的兩種實(shí)現(xiàn)方式
文章URL:http://www.muchs.cn/news23/134623.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站制作、搜索引擎優(yōu)化移動(dòng)網(wǎng)站建設(shè)、域名注冊(cè)、外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁(yè)設(shè)計(jì)公司