Python生成詞雲

1 概述

利用Python生成簡單的詞雲,須要的工具是cython,wordcloud與anaconda.python

2 準備工做

包括安裝cython,wordcloud與anaconda.瀏覽器

2.1 安裝anaconda

下載官網
在這裏插入圖片描述
選擇對應的版本下載便可.bash

2.2 安裝cython

cython是爲了安裝wordcloud準備的.工具

pip -m pip install --upgrade cython

在這裏插入圖片描述

2.3 安裝wordcloud

安裝wordcloud前須要先安裝Microsoft Visuall C++ 14.0.
這裏下載
安裝好了之後重啓,輸入測試

python -m easy_install wordcloud

在這裏插入圖片描述

3 使用

3.1 打開Jupyter

打開Jupyter Notebook.
在這裏插入圖片描述
而後會在瀏覽器打開這個頁面,新建一個notebook.
在這裏插入圖片描述
先把須要的庫導入:字體

from wordcloud import WordCloud
import matplotlib.pyplot as plt

在這裏插入圖片描述

3.2 建立文字庫

簡單的文字庫能夠直接選擇一個txt文件,複雜的話能夠選擇建立一個excel,導出爲csv文件,而後利用pandas庫的read_csv()讀入文件.這裏建立一個txt,空格分隔單詞便可.
在這裏插入圖片描述
而後上傳到Jupyter中:
在這裏插入圖片描述編碼

3.3 生成詞雲

首先讀入文件:spa

text = open('1.txt').read()

而後使用WordCloud().generate(text),在裏面設置各類屬性.3d

wc=WordCloud(
    width=800,
    repeat=True,
    height=800).generate(text)

這裏設置了高度與寬度,容許重複.excel

plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.show()

顯示詞雲,

interpolation='bilinear'

會使顯示平滑更加平滑,axis("off")表示不顯示座標軸.
下面是效果:
在這裏插入圖片描述

3.4 注意事項

若是含有漢字,首先在讀取時設置編碼:

text = open('1.txt',encoding='utf-8')

而後再生成詞雲時設置字體:

wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')

測試:
在這裏插入圖片描述

text=open('1.txt',encoding='utf-8').read()
wc=WordCloud(
    width=1300,
    repeat=True,
    font_path=r'C:\Windows\Fonts\simfang.ttf',
    height=1300).generate(text)
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.savefig('aaaa.jpg')

在這裏插入圖片描述
在這裏插入圖片描述

相關文章
相關標籤/搜索