做者:xiaoyu
微信公衆號:Python數據科學
知乎:python數據分析師python
詞雲的使用相信你們已經不陌生了,使用很簡單,直接調用wordcloud
包就能夠了。它的主要功能是根據文本詞彙和詞彙頻率生成圖片,從中能夠直觀的看出各個詞彙所佔比重。最近正好想作一我的的logo,因而乎決定使用詞雲來製做完成。正則表達式
pip install wordcloud
使用 pip 安裝你確定會遇到一個坑,安裝過程當中可能會報錯,提示你安裝 Microsoft Visual C++ 14.0,可是這個安裝過程很耗時。微信
有另外一個方法能夠解決,就是下載相應的whl
文件安裝。下載連接:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordclouddom
文件下載後,cmd 進入whl
文件所在文件夾下,而後輸入如下命令:函數
pip install wordcloud-1.4.1-cp36-cp36m-win_amd64.whl
安裝成功後咱們立刻開始製做咱們的圖片。學習
from os import path from PIL import Image import numpy as np import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator d = path.dirname(__file__) # 讀文本文件 text = open(path.join(d, 'data.txt')).read() # 讀取自定義圖片 alice_coloring = np.array(Image.open(path.join(d, "pic.jpg"))) # 你能夠經過 mask 參數 來設置詞雲形狀 wc = WordCloud(background_color="white",max_words=2000, mask=alice_coloring, max_font_size=60,random_state=102,scale=8, font_path="C:\Windows\Fonts\msyhbd.ttf").generate(text) wc.generate_from_text(text) print('開始加載文本') # 改變字體顏色 img_colors = ImageColorGenerator(alice_coloring) # 字體顏色爲背景圖片的顏色 wc.recolor(color_func=img_colors) # 顯示詞雲圖 plt.imshow(wc, interpolation="bilinear") # 是否顯示x軸、y軸下標 plt.axis('off') plt.show() # 得到模塊所在的路徑的 d = path.dirname(__file__) # 將多個路徑組合後返回 wc.to_file(path.join(d, "h16.jpg")) print('生成詞雲成功!')
上面 text 文本內容是經過爬蟲採集的,爬取的關於數據科學的一篇文章,有了文本源以後準備好你想要生成詞雲的圖片就好了。字體
配置 wordcloud
的參數對於圖片效果尤其重要,下面咱們着重介紹一下wordcloud
的參數含義:人工智能
使用的照片是博主本身的照片。
spa
——————end——————code
關注微信公衆號Python數據科學,獲取 120G
人工智能 學習資料。