分析基于用戶瀏覽記錄的網(wǎng)頁(yè)rank思路

2024-03-27    分類: 網(wǎng)站建設(shè)

Google的pagerank就不多介紹了,一個(gè)能衡量網(wǎng)頁(yè)重要程度的算法,本質(zhì)上是網(wǎng)頁(yè)相互投票的結(jié)果,基于這個(gè)特性,我們可以通過(guò)使用sitemap讓搜索引擎盡可能瀏覽到多的網(wǎng)站內(nèi)容,也可以通過(guò)多做外鏈來(lái)提高網(wǎng)站的PR值,達(dá)到SEO的目的。

市場(chǎng)上大多數(shù)搜索引擎都在使用pagerank類似的方法,且為了保證公正性,都采用純機(jī)器運(yùn)行的方式,通過(guò)網(wǎng)頁(yè)爬蟲(chóng)來(lái)遍歷網(wǎng)站,這就出現(xiàn)了一些有趣的問(wèn)題:

1、一個(gè)網(wǎng)頁(yè)的內(nèi)容是很棒的,但是由于外鏈太少,爬蟲(chóng)在設(shè)定的深度閾值下可能無(wú)法爬到它,成為了少人問(wèn)津的“暗內(nèi)容”

2、部分網(wǎng)站因?yàn)镻R值很高,即使轉(zhuǎn)載的內(nèi)容或是價(jià)值不高的內(nèi)容,也可能有很好的檢索排名,即使技術(shù)領(lǐng)先的搜索引擎采用語(yǔ)義網(wǎng)絡(luò)的方法識(shí)別優(yōu)質(zhì)內(nèi)容,效果依然不夠好

為了規(guī)避以上問(wèn)題,引入用戶數(shù)據(jù)來(lái)評(píng)判網(wǎng)頁(yè)內(nèi)容的重要性及質(zhì)量,是一個(gè)可研究方向,怎么做呢?

假設(shè): 瀏覽行為及時(shí)長(zhǎng)是對(duì)網(wǎng)頁(yè)質(zhì)量的最好評(píng)判,相當(dāng)于用戶標(biāo)注,在大規(guī)模數(shù)據(jù)的情況下,效果應(yīng)優(yōu)于機(jī)器

原理:

1、通過(guò)瀏覽器或其他客戶端軟件,最好的防火墻或其他安全軟件,獲取用戶瀏覽日志,上傳給搜索引擎的爬蟲(chóng)數(shù)據(jù)庫(kù),即是得到用戶瀏覽數(shù)據(jù)

2、爬蟲(chóng)匹配已有索引庫(kù),找到未索引內(nèi)容,爬之

3、利用用戶日志給網(wǎng)頁(yè)投票,瀏覽時(shí)間越長(zhǎng)權(quán)重越高,計(jì)算出網(wǎng)頁(yè)的rank

缺陷:

1、依賴客戶端

2、有用戶隱私問(wèn)題

規(guī)避:

1、提出云殺毒、云防御、云安全,讓用戶同意上傳瀏覽記錄

2、偷偷上傳,將瀏覽記錄(其他文件也可以)加密并分拆上傳,在服務(wù)器端組合還原

好了,思路說(shuō)完了,來(lái)給它起個(gè)響亮高深名字:peoplerank

最后,我這是很嚴(yán)肅地說(shuō)技術(shù)。

本文來(lái)自成都品牌網(wǎng)站建設(shè)網(wǎng)站設(shè)計(jì)公司-創(chuàng)新互聯(lián)

網(wǎng)站題目:分析基于用戶瀏覽記錄的網(wǎng)頁(yè)rank思路
URL網(wǎng)址:http://muchs.cn/news14/322064.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應(yīng)式網(wǎng)站、自適應(yīng)網(wǎng)站、虛擬主機(jī)企業(yè)建站、建站公司、定制網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷型網(wǎng)站建設(shè)