Python生成詞雲

1 概述

利用Python生成簡單的詞雲,須要的工具是cython,wordcloud與anaconda.python

2 準備工做

包括安裝cython,wordcloud與anaconda.瀏覽器

2.1 安裝anaconda

下載官網bash

在這裏插入圖片描述

選擇對應的版本下載便可.工具

2.2 安裝cython

cython是爲了安裝wordcloud準備的.測試

pip -m pip install --upgrade cython

在這裏插入圖片描述

2.3 安裝wordcloud

安裝wordcloud前須要先安裝Microsoft Visuall C++ 14.0.字體

這裏下載編碼

安裝好了之後重啓,輸入excel

python -m easy_install wordcloud

在這裏插入圖片描述

3 使用

3.1 打開Jupyter

打開Jupyter Notebook.code

在這裏插入圖片描述

而後會在瀏覽器打開這個頁面,新建一個notebook.blog

在這裏插入圖片描述

先把須要的庫導入:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

在這裏插入圖片描述

3.2 建立文字庫

簡單的文字庫能夠直接選擇一個txt文件,複雜的話能夠選擇建立一個excel,導出爲csv文件,而後利用pandas庫的read_csv()讀入文件.這裏建立一個txt,空格分隔單詞便可.

在這裏插入圖片描述

而後上傳到Jupyter中:

在這裏插入圖片描述

3.3 生成詞雲

首先讀入文件:

text = open('1.txt').read()

而後使用WordCloud().generate(text),在裏面設置各類屬性.

wc=WordCloud(
    width=800,
    repeat=True,
    height=800).generate(text)

這裏設置了高度與寬度,容許重複.

plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.show()

顯示詞雲,

interpolation='bilinear'

會使顯示平滑更加平滑,axis("off")表示不顯示座標軸.

下面是效果:

在這裏插入圖片描述

3.4 注意事項

若是含有漢字,首先在讀取時設置編碼:

text = open('1.txt',encoding='utf-8')

而後再生成詞雲時設置字體:

wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')

測試:

在這裏插入圖片描述

text=open('1.txt',encoding='utf-8').read()
wc=WordCloud(
    width=1300,
    repeat=True,
    font_path=r'C:\Windows\Fonts\simfang.ttf',
    height=1300).generate(text)
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.savefig('aaaa.jpg')

在這裏插入圖片描述

在這裏插入圖片描述

相關文章
相關標籤/搜索