利用Python生成簡單的詞雲,須要的工具是cython,wordcloud與anaconda.python
包括安裝cython,wordcloud與anaconda.瀏覽器
下載官網bash
選擇對應的版本下載便可.工具
cython是爲了安裝wordcloud準備的.測試
pip -m pip install --upgrade cython
安裝wordcloud前須要先安裝Microsoft Visuall C++ 14.0.字體
這裏下載編碼
安裝好了之後重啓,輸入excel
python -m easy_install wordcloud
打開Jupyter Notebook.code
而後會在瀏覽器打開這個頁面,新建一個notebook.blog
先把須要的庫導入:
from wordcloud import WordCloud import matplotlib.pyplot as plt
簡單的文字庫能夠直接選擇一個txt文件,複雜的話能夠選擇建立一個excel,導出爲csv文件,而後利用pandas庫的read_csv()讀入文件.這裏建立一個txt,空格分隔單詞便可.
而後上傳到Jupyter中:
首先讀入文件:
text = open('1.txt').read()
而後使用WordCloud().generate(text),在裏面設置各類屬性.
wc=WordCloud( width=800, repeat=True, height=800).generate(text)
這裏設置了高度與寬度,容許重複.
plt.imshow(wc,interpolation="bilinear") plt.axis("off") plt.show()
顯示詞雲,
interpolation='bilinear'
會使顯示平滑更加平滑,axis("off")表示不顯示座標軸.
下面是效果:
若是含有漢字,首先在讀取時設置編碼:
text = open('1.txt',encoding='utf-8')
而後再生成詞雲時設置字體:
wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')
測試:
text=open('1.txt',encoding='utf-8').read() wc=WordCloud( width=1300, repeat=True, font_path=r'C:\Windows\Fonts\simfang.ttf', height=1300).generate(text) plt.imshow(wc,interpolation="bilinear") plt.axis("off") plt.savefig('aaaa.jpg')