做者:AI算法與圖像處理算法
參考:http://www.sohu.com/a/149657007_236714網絡
由詞彙組成相似雲的彩色圖形。「詞雲」就是對網絡文本中出現頻率較高的「關鍵詞」予以視覺上的突出,造成「關鍵詞雲層」或「關鍵詞渲染」,從而過濾掉大量的文本信息,使瀏覽網頁者只要一眼掃過文本就能夠領略文本的主旨。app
一、直觀,高大上
二、可裝逼,很瀟灑函數
命令:pip install jieba
命令:pip install wordcloud
備註:對於pycharm等可採用各自的方法導入包學習
文本:可爬取網上資料或某歌曲書籍等關鍵字,亦或是像我是本身手動輸入文字並用tab隔開
圖片:找本身喜歡的圖片,這裏我採用喬巴的圖片做爲背景,並且除了主要人物外,其餘背景都爲白色,顯示效果較好。字體
# coding: utf-8
import jieba
from wordcloud import WordCloud,STOPWORDS
from scipy.misc import imread # 處理圖像的函數
import matplotlib.pyplot as plt
# 讀取文本文件
text = open('/media/pzw/0E50196C0E50196C/weixin/t1.txt', 'r').read()
# 對文本進行分詞
cut_text = ''.join(jieba.cut(text))
# 讀取圖片
color_mask = imread('/media/pzw/0E50196C0E50196C/weixin/qiaoba.jpg')
# 生成詞雲
cloud = WordCloud(font_path='G:/py/wc/new_songti.ttc',# 這裏是導入字體,由於我是採用英文的,全部不導入也並不影響,如果中文的或者有其餘的字符須要本身選擇合適的字體包
background_color="white",
mask=color_mask,
max_words=2000,
max_font_size=80)
word_cloud = cloud.generate(cut_text)
# 輸出圖片
plt.axis('off')
plt.imshow(word_cloud)
plt.show()
複製代碼
今天的學習就到這裏了,但願你們能點個右下角小小的「好看」spa
很是感謝哈!!!!3d
END code