用Python搞出本身的雲詞圖 | 【帶你裝起來】

時間 2019-12-08

標籤 python 搞出本身帶你裝起來欄目 Python 简体版

原文原文鏈接

做者：AI算法與圖像處理算法

參考：http://www.sohu.com/a/149657007_236714網絡

雲詞圖簡介

什麼詞雲

由詞彙組成相似雲的彩色圖形。「詞雲」就是對網絡文本中出現頻率較高的「關鍵詞」予以視覺上的突出，造成「關鍵詞雲層」或「關鍵詞渲染」，從而過濾掉大量的文本信息，使瀏覽網頁者只要一眼掃過文本就能夠領略文本的主旨。app

有何做用

一、直觀，高大上
二、可裝逼，很瀟灑函數

準備工做

一、導入包——jieba和wordcloud

命令：pip install jieba
命令：pip install wordcloud
備註：對於pycharm等可採用各自的方法導入包學習

二、文本和圖片的準備

文本：可爬取網上資料或某歌曲書籍等關鍵字，亦或是像我是本身手動輸入文字並用tab隔開
圖片：找本身喜歡的圖片，這裏我採用喬巴的圖片做爲背景，並且除了主要人物外，其餘背景都爲白色，顯示效果較好。字體

採用的文本內容：

採用的圖片：

代碼展現

# coding: utf-8
import jieba
from wordcloud import WordCloud,STOPWORDS
from scipy.misc import imread # 處理圖像的函數
import matplotlib.pyplot as plt

# 讀取文本文件
text = open('/media/pzw/0E50196C0E50196C/weixin/t1.txt', 'r').read()
# 對文本進行分詞
cut_text = ''.join(jieba.cut(text))
# 讀取圖片
color_mask = imread('/media/pzw/0E50196C0E50196C/weixin/qiaoba.jpg')
# 生成詞雲
cloud = WordCloud(font_path='G:/py/wc/new_songti.ttc',# 這裏是導入字體，由於我是採用英文的，全部不導入也並不影響，如果中文的或者有其餘的字符須要本身選擇合適的字體包
                  background_color="white",
                  mask=color_mask,
                  max_words=2000,
                  max_font_size=80)
word_cloud = cloud.generate(cut_text)

# 輸出圖片
plt.axis('off')
plt.imshow(word_cloud)
plt.show()
複製代碼