分類(lèi)信息網(wǎng)站防范垃圾信息的方法有哪些

2014-02-11    分類(lèi): 網(wǎng)站建設(shè)

一、通過(guò)提取聯(lián)系信息的聯(lián)系方式,建立聯(lián)系方式黑名單

垃圾信息制造者無(wú)論IP如何變化,內(nèi)容如何變化,聯(lián)系方式是不變的。我們可以基于這點(diǎn)建立聯(lián)系方式黑名單數(shù)據(jù)庫(kù)。目前,中國(guó)最常用的通信方式是電話號(hào)碼、QQ號(hào)碼、網(wǎng)址、電子郵件地址等。這些都具有一定特征,容易通過(guò)正則表達(dá)式提取。

那么如何構(gòu)建黑名單呢?如果一個(gè)信息被用戶惡評(píng)了五次,那么該信息就被自動(dòng)標(biāo)記為惡評(píng)狀態(tài)并隱藏。當(dāng)一條信息被放在惡評(píng)中時(shí),該惡評(píng)信息中的所有聯(lián)系信息都被存儲(chǔ)在黑名單數(shù)據(jù)庫(kù)中,并且出現(xiàn)頻率字段加1。這樣,我們就有了聯(lián)系信息的黑名單數(shù)據(jù)庫(kù)。這個(gè)數(shù)據(jù)庫(kù)有聯(lián)系信息出現(xiàn)的頻率和最新出現(xiàn)時(shí)間。除了用戶投訴需要人工辨別之外,所有這些操作都是由機(jī)器自動(dòng)進(jìn)行的。

二、識(shí)別并刪除異地商家信息

分類(lèi)信息網(wǎng)站的特點(diǎn)之一是地方性,本地用戶來(lái)到分類(lèi)信息網(wǎng)站查看本地出租、朋友、服務(wù)等信息。因此,如果信息中有異地電話號(hào)碼,則應(yīng)將其看作垃圾信息處理。這可以通過(guò)手機(jī)歸屬地?cái)?shù)據(jù)庫(kù)和電話區(qū)號(hào)數(shù)據(jù)庫(kù)來(lái)判斷,但不是所有的類(lèi)別都采用這種方法,比如交友、尋人等都不應(yīng)該使用這種方法。但是,像二手車(chē)類(lèi)別和服務(wù)類(lèi)別完全可以用來(lái)這種方法過(guò)濾異地信息。

三、限制某些類(lèi)別在同一天一個(gè)用戶只能發(fā)布一條消息

重復(fù)的信息太多,對(duì)用戶體驗(yàn)不好。這里重復(fù)信息的定義是指相同的用戶或企業(yè)(包括企業(yè)雇傭的信息發(fā)布者)發(fā)布相同或相似的信息。這些類(lèi)別包括生活服務(wù)、商務(wù)服務(wù)、培訓(xùn)、交友、車(chē)輛等。

四、關(guān)鍵字過(guò)濾

最后,不要忘記關(guān)鍵字過(guò)濾。一些有害和敏感的關(guān)鍵字必須被過(guò)濾掉。

以上這些方法是能夠被分類(lèi)信息網(wǎng)站采用的簡(jiǎn)單有效的反垃圾郵件信息的方法,如果能夠用貝葉斯算法對(duì)垃圾郵件進(jìn)行過(guò)濾,將是更好的。

本文標(biāo)題:分類(lèi)信息網(wǎng)站防范垃圾信息的方法有哪些
鏈接URL:http://www.muchs.cn/news/6036.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站網(wǎng)站設(shè)計(jì)、電子商務(wù)、網(wǎng)站維護(hù)全網(wǎng)營(yíng)銷(xiāo)推廣、靜態(tài)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷(xiāo)型網(wǎng)站建設(shè)