python如何根據(jù)文本生成詞云圖-創(chuàng)新互聯(lián)

這篇文章給大家分享的是有關(guān)python如何根據(jù)文本生成詞云圖的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

作為一家“創(chuàng)意+整合+營(yíng)銷”的成都網(wǎng)站建設(shè)機(jī)構(gòu),我們?cè)跇I(yè)內(nèi)良好的客戶口碑。成都創(chuàng)新互聯(lián)公司提供從前期的網(wǎng)站品牌分析策劃、網(wǎng)站設(shè)計(jì)、網(wǎng)站設(shè)計(jì)制作、網(wǎng)站建設(shè)、創(chuàng)意表現(xiàn)、網(wǎng)頁(yè)制作、系統(tǒng)開發(fā)以及后續(xù)網(wǎng)站營(yíng)銷運(yùn)營(yíng)等一系列服務(wù),幫助企業(yè)打造創(chuàng)新的互聯(lián)網(wǎng)品牌經(jīng)營(yíng)模式與有效的網(wǎng)絡(luò)營(yíng)銷方法,創(chuàng)造更大的價(jià)值。

效果

python如何根據(jù)文本生成詞云圖

代碼

from wordcloud import WordCloud
import codecs
import jieba
#import jieba.analyse as analyse
from scipy.misc import imread
import os
from os import path
import matplotlib.pyplot as plt
from PIL import Image, ImageDraw, ImageFont


# 繪制詞云
def draw_wordcloud():
  #讀入一個(gè)txt文件
  comment_text = open('data.txt','r',encoding='utf-8').read()
  #結(jié)巴分詞,生成字符串,如果不通過分詞,無法直接生成正確的中文詞云
  cut_text = " ".join(jieba.cut(comment_text))
  d = path.dirname(__file__) # 當(dāng)前文件文件夾所在目錄
  color_mask = imread("bilibili.jpg") # 讀取背景圖片
  cloud = WordCloud(
    #設(shè)置字體,不指定就會(huì)出現(xiàn)亂碼
    font_path="C:/Windows/Fonts/STXINGKA.TTF",
    #font_path=path.join(d,'simsun.ttc'),
    #設(shè)置背景色
    background_color='white',
    #詞云形狀
    mask=color_mask,
    #允許大詞匯
    max_words=2000,
    #大號(hào)字體
    max_font_size=100
  )
  word_cloud = cloud.generate(cut_text) # 產(chǎn)生詞云
  word_cloud.to_file("bilibilirankword.jpg") #保存圖片
  # 顯示詞云圖片
  plt.imshow(word_cloud)
  plt.axis('off')
  plt.show()

if __name__ == '__main__':
  draw_wordcloud()

步驟以及注意點(diǎn)

1.首先要導(dǎo)入對(duì)應(yīng)的庫(kù)

2.文字會(huì)根據(jù)背景圖而分布

3.背景圖的選擇對(duì)于最終效果很重要,選一個(gè)盡量大一點(diǎn)的背景圖,這個(gè)背景圖隨便找就好,任何圖片都可以不過最好大一些,圖案不太復(fù)雜

4.如果字號(hào)小的話,可以調(diào)整字體,或者換個(gè)背景圖

5.font_path要使用自己的字體庫(kù),不過你的電腦是windows的話,應(yīng)該不用改,用我這個(gè)就可以,除此之外呢,這個(gè)字體如果是別的的話,可能會(huì)出現(xiàn)

中文不能產(chǎn)生詞云圖的現(xiàn)象,總之用我的就好了。

感謝各位的閱讀!關(guān)于“python如何根據(jù)文本生成詞云圖”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。

網(wǎng)頁(yè)標(biāo)題:python如何根據(jù)文本生成詞云圖-創(chuàng)新互聯(lián)
轉(zhuǎn)載來于:http://muchs.cn/article4/icoie.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、微信公眾號(hào)、云服務(wù)器、網(wǎng)站排名、搜索引擎優(yōu)化關(guān)鍵詞優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護(hù)公司