分類信息網(wǎng)站防范垃圾信息的方法有哪些

2014-02-11    分類: 網(wǎng)站建設(shè)

一、通過提取聯(lián)系信息的聯(lián)系方式,建立聯(lián)系方式黑名單

垃圾信息制造者無論IP如何變化,內(nèi)容如何變化,聯(lián)系方式是不變的。我們可以基于這點(diǎn)建立聯(lián)系方式黑名單數(shù)據(jù)庫。目前,中國最常用的通信方式是電話號(hào)碼、QQ號(hào)碼、網(wǎng)址、電子郵件地址等。這些都具有一定特征,容易通過正則表達(dá)式提取。

那么如何構(gòu)建黑名單呢?如果一個(gè)信息被用戶惡評(píng)了五次,那么該信息就被自動(dòng)標(biāo)記為惡評(píng)狀態(tài)并隱藏。當(dāng)一條信息被放在惡評(píng)中時(shí),該惡評(píng)信息中的所有聯(lián)系信息都被存儲(chǔ)在黑名單數(shù)據(jù)庫中,并且出現(xiàn)頻率字段加1。這樣,我們就有了聯(lián)系信息的黑名單數(shù)據(jù)庫。這個(gè)數(shù)據(jù)庫有聯(lián)系信息出現(xiàn)的頻率和最新出現(xiàn)時(shí)間。除了用戶投訴需要人工辨別之外,所有這些操作都是由機(jī)器自動(dòng)進(jìn)行的。

二、識(shí)別并刪除異地商家信息

分類信息網(wǎng)站的特點(diǎn)之一是地方性,本地用戶來到分類信息網(wǎng)站查看本地出租、朋友、服務(wù)等信息。因此,如果信息中有異地電話號(hào)碼,則應(yīng)將其看作垃圾信息處理。這可以通過手機(jī)歸屬地?cái)?shù)據(jù)庫和電話區(qū)號(hào)數(shù)據(jù)庫來判斷,但不是所有的類別都采用這種方法,比如交友、尋人等都不應(yīng)該使用這種方法。但是,像二手車類別和服務(wù)類別完全可以用來這種方法過濾異地信息。

三、限制某些類別在同一天一個(gè)用戶只能發(fā)布一條消息

重復(fù)的信息太多,對(duì)用戶體驗(yàn)不好。這里重復(fù)信息的定義是指相同的用戶或企業(yè)(包括企業(yè)雇傭的信息發(fā)布者)發(fā)布相同或相似的信息。這些類別包括生活服務(wù)、商務(wù)服務(wù)、培訓(xùn)、交友、車輛等。

四、關(guān)鍵字過濾

最后,不要忘記關(guān)鍵字過濾。一些有害和敏感的關(guān)鍵字必須被過濾掉。

以上這些方法是能夠被分類信息網(wǎng)站采用的簡單有效的反垃圾郵件信息的方法,如果能夠用貝葉斯算法對(duì)垃圾郵件進(jìn)行過濾,將是更好的。

當(dāng)前標(biāo)題:分類信息網(wǎng)站防范垃圾信息的方法有哪些
文章路徑:http://muchs.cn/news36/6036.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護(hù)Google、網(wǎng)站改版、網(wǎng)站排名、網(wǎng)站導(dǎo)航、移動(dòng)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設(shè)