行業(yè)動(dòng)態(tài)基于網(wǎng)頁結(jié)構(gòu)與語言特征的垃圾網(wǎng)頁鏈接檢測方法

2022-05-02    分類: 網(wǎng)站建設(shè)

檢測spam網(wǎng)頁仍是一個(gè)具有挑戰(zhàn)性的研究領(lǐng)域。經(jīng)過實(shí)驗(yàn)與對比,算法已經(jīng)可以基本解決spam檢測的問題,準(zhǔn)確率較高,又不會(huì)出現(xiàn)過高的誤報(bào)率和漏報(bào)率。同時(shí),如果用戶對誤報(bào)率和漏報(bào)率有所要求時(shí),也可以通過修正優(yōu)勢率的閾值來實(shí)現(xiàn)。

但是,算法仍有一些需要深入研究的問題。后續(xù)工作需要更進(jìn)一步擴(kuò)大并完善初始數(shù)據(jù),從而優(yōu)化對優(yōu)勢率字典的構(gòu)建。同時(shí),希望更進(jìn)一步地研究優(yōu)勢率閾值的選取,從而更準(zhǔn)確地對網(wǎng)頁進(jìn)行檢測。

最后,網(wǎng)頁中,塊與塊之間是有聯(lián)系的,而本算法簡化了這一部分,把塊當(dāng)作獨(dú)立的個(gè)體進(jìn)行處理。所以,在后續(xù)研究中,可以將塊與塊之間的相似度,如結(jié)構(gòu)相似度、文本內(nèi)容相似度等加入特征的選取和計(jì)算、

本文題目:行業(yè)動(dòng)態(tài)基于網(wǎng)頁結(jié)構(gòu)與語言特征的垃圾網(wǎng)頁鏈接檢測方法
文章網(wǎng)址:http://www.muchs.cn/news22/148722.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計(jì)電子商務(wù)、搜索引擎優(yōu)化、企業(yè)建站、App設(shè)計(jì)服務(wù)器托管

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都app開發(fā)公司