在看完了如何作詞雲的教程,試用微信聊天記錄作一個demo練手。關於詞雲,網上有大量的教程,可隨意參考,注意python的版本問題便可。python
用到的工具是一款微信聊天記錄查看軟件,分享以下,侵權則刪。 連接: https://pan.baidu.com/s/1c1EDh52 密碼: 129q正則表達式
使用:須要一個root後的手機,而後導出便可,對於使用了沒有root的手機能夠使用微信的聊天記錄轉移功能,將聊天記錄轉移到已root的手機,記得設置爲只轉移文字哦,否則效率很低。 因爲我已經把記錄刪了,因此就不截圖了,軟件比較簡單,本身琢磨便可。 導出後能夠查看,可是不能直接導成文本(收費),沒辦法,只能手動複製粘貼。而後把暱稱時間什麼的 ctrl+h替換一下,(20171018 20:06)能夠用正則表達式([^)]*)來替換哦。(其實能夠用python......我太low啦)微信
ps:寫demo建議使用Anaconda,挺方便。工具
%pylab inline
import jieba
#jieba用來對中文分詞
import matplotlib.pyplot as plt
from wordcloud import WordCloud
#聊天記錄
filename = "miao.txt"
with open(filename,encoding='UTF-8') as f:
mytext = f.read()
#打開文本
mytext = " ".join(jieba.cut(mytext))
photo_coloring = imread('2016.jpg')
#詞雲背景圖片白底
wordcloud = WordCloud(background_color="white",font_path="simsun.ttf",max_words=200,mask=photo_coloring).generate(mytext)
#中文注意下載simsun.ttf中文字體來替換
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
複製代碼
font_path : 使用的字體的路徑 width : int (default=400) //輸出的畫布寬度,默認爲400像素 height : int (default=200) //輸出的畫布高度,默認爲200像素 設置圖片默認的大小,可是若是使用背景圖片的話,那麼保存的圖片大小將會按照其大小保存(測試好像只是白底變大了) mask:就是文字所在的背景圖啦,建議使用顏色較深的圖。 其餘參數可自行搜索wordcloud全部參數。測試
哦對,最後結果: 字體
mdzz!