WordCloud

1. wordcloud概述

wordcloud是優秀的詞雲展現第三方
詞雲以詞語爲基本單位,更加直觀和藝術地展現文本python

2.安裝wordcloud

在編寫程序以前須要下載第三方庫:
jieba
wordcloud
scipypython2.7

python3.0是:pip3 install module_name
python2.7是:pip install module_name函數

3.wordcloud庫的使用

  • wordcloud庫把詞雲看成一個WordCloud對象
  • wordcloud.WordCloud()表明一個文本對應的詞雲
  • 能夠根據文本中詞語出現的頻率等參數繪製詞雲
  • 詞雲的繪製形狀、尺寸和顏色均可以設定

4. wordcloud.WordCloud()中參數解釋

參數 描述
width 指定詞雲對象生成圖片的寬度,默認400像素>>>w=wordcloud.WordCloud(width=600)
height 指定詞雲對象生成圖片的高度,默認200像素>>>w=wordcloud.WordCloud(height=400)
min_font_size 指定詞雲中字體的最小字號,默認4號>>>w=wordcloud.WordCloud(min_font_size=10)
max_font_size 指定詞雲中字體的最大字號,根據高度自動調節>>>w=wordcloud.WordCloud(max_font_size=20)
font_step 指定詞雲中字體字號的步進間隔,默認爲1>>>w=wordcloud.WordCloud(font_step=2)
font_path 指定字體文件的路徑,默認None>>>w=wordcloud.WordCloud(font_path="msyh.ttc")
max_words 指定詞雲顯示的最大單詞數量,默認200>>>w=wordcloud.WordCloud(max_words=20)
stop_words 指定詞雲的排除詞列表,即不顯示的單詞列表>>>w=wordcloud.WordCloud(stop_words={"Python"})
mask 指定詞雲形狀,默認爲長方形,須要引用imread()函數>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk)
background_color 指定詞雲圖片的背景顏色,默認爲黑色>>>w=wordcloud.WordCloud(background_color="white")

5.程序模版

import jieba
import wordcloud

file1 = open("country.txt", "r")     #打開文本
t = file1.read()                                     #讀取所有內容
file1.close()                                         #關閉文件

ls = jieba.lcut(t)                                  #將讀取內容轉化成列表形式
txt = " ".join(ls)                                   #用空格鏈接內容,必須是空格

w = wordcloud.WordCloud(font_path="ukai.ttc", width=1000, height=700,\
        background_color="white")
w.generate(txt)                #向wordcloud對象中添加txt文本
w.to_file("map.png")    #將詞雲輸出成圖像文件

5.圖片實例

  • 在自定義圖片輸出格式以後,好比輸出中國地圖樣式的圖片,只需在上述代碼中添加以下幾行代碼便可:
from scipy.misc import imread
mask=imread("chinamap.jpg")       #自定義要輸出的詞雲形狀,注意添加的圖片背景顏色必須與要輸出的圖片一致。

在wordcloud.WordCloud()中添加參數mask=mask

相關文章
相關標籤/搜索