初窺wordcloud之老司機帶你定製詞雲圖片

抓緊上車啦python

#-*-coding:utf-8 -*-

from os import path
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
#用來畫詞雲的。
import matplotlib.pyplot as plt
#用來解析特殊的圖片模板,numpy也能夠的。
from scipy.misc import imread

#第一步讀你要製做成詞雲的源文件,少年記得用‘r’去讀,手抖用了次‘w+’結果文件讓我清空了。。。
dir=r'C:\Users\cchen\Desktop\MPLS_2.txt'
text=open(dir,'r').read()
#用導入的scipy的imread去解析模板文件,圖片越大解析越慢
alice_coloring = imread(r'C:\Users\cchen\Desktop\cloud.jpg')
#print alice_coloring 所料不錯,是個挺大的矩陣。大到卡住了

#生成詞雲,這裏能夠用到不少的參數
#background_color顧名思義,是背景的顏色
#max_words 詞雲顯示的最大詞數
#mask 主角,咱們的我的定製的模板
#max_font_size 字體的最大值
#stopwords 去除一些經常使用詞彙,好比a,is,the之類的,你能夠用add加上你不想顯示的詞。
#font_path='./font/cabin-sketch.bold.ttf設置字體
wc = WordCloud(background_color="white", max_words=600, mask=alice_coloring,max_font_size=200, random_state=42,stopwords=STOPWORDS.add("said"))
wc.generate(text)

#show出來定製化的詞雲,顏色是隨機的五光十色,第一個圖就是啦
plt.figure()
plt.imshow(wc)
plt.axis("off")



# 我這麼低調的人確定要用原圖的黑色啊
# 能夠用color_func=image_colors來從新畫
# 根據模板獲取顏色
image_colors = ImageColorGenerator(alice_coloring)
#獲取到的顏色模板,並用該模板來重畫詞雲
plt.imshow(wc.recolor(color_func=image_colors))
plt.axis("off")
#來看下咱們的模板
plt.figure()
plt.imshow(alice_coloring, cmap=plt.cm.gray)
plt.axis("off")
plt.show()

來看看依照原圖來的模板dom

咱們的模板python2.7

 

 

是否是很炫酷。字體

由於python2.7的蛋疼的中文編碼問題。若是是中文文檔的話,能夠用jieba分詞對文件進行次頻處理在生成詞雲。編碼

挖個坑,之後填。。spa

相關文章
相關標籤/搜索