lda輿情監(jiān)測遇到的問題-創(chuàng)新互聯(lián)

1、問題一

為企業(yè)提供成都網(wǎng)站設計、做網(wǎng)站、成都外貿(mào)網(wǎng)站建設公司、網(wǎng)站優(yōu)化、成都營銷網(wǎng)站建設、競價托管、品牌運營等營銷獲客服務。創(chuàng)新互聯(lián)擁有網(wǎng)絡營銷運營團隊,以豐富的互聯(lián)網(wǎng)營銷經(jīng)驗助力企業(yè)精準獲客,真正落地解決中小企業(yè)營銷獲客難題,做到“讓獲客更簡單”。自創(chuàng)立至今,成功用技術(shù)實力解決了企業(yè)“網(wǎng)站建設、網(wǎng)絡品牌塑造、網(wǎng)絡營銷”三大難題,同時降低了營銷成本,提高了有效客戶轉(zhuǎn)化率,獲得了眾多企業(yè)客戶的高度認可!

LDA求出主題-詞 概率phi之后??梢灾烂總€主題下每個詞的概率,之后怎么確定每篇文檔的主題分布呢?

 在 gibbs抽樣穩(wěn)定之后,統(tǒng)計每篇文檔topic出現(xiàn)的頻率就可以算出來。

2、問題二

每個主題下的詞有可能是相同的,只是概率不同而已。統(tǒng)計時這個應該算在哪個主題下?

3、問題三

訓練集--維基百科數(shù)據(jù)集是 自己用爬蟲爬,還是直接下載。

4、問題四

LDA模型構(gòu)建完后,可以估計每篇文檔的主題。但是之后要怎么知道當前輿論的熱點呢?

5、問題五

Elasticsearch 是用來存取新聞和微博模塊的數(shù)據(jù),這樣我可以設置一個表,表中的每一項(url-主題-發(fā)布時間-爬取時間-作者-摘要)這樣搜索的時候就可以搜索出關(guān)于某個主題的所有url。

6、問題六

關(guān)于LDA的訓練集的問題。這個訓練集是自己爬取,然后分詞得到的。

7、問題七

怎么將輿情信息展示出來。(按爬取文檔的主題出現(xiàn)的概率排序)可以用圖表表示出所有主題出現(xiàn)的的概率。柱狀圖。

解決完這七個問題,整個系統(tǒng)基本成型

另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

本文名稱:lda輿情監(jiān)測遇到的問題-創(chuàng)新互聯(lián)
文章地址:http://muchs.cn/article18/djijdp.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、網(wǎng)站設計網(wǎng)站制作、網(wǎng)頁設計公司、App設計、動態(tài)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務器托管