爬取學校官網新聞-生成詞雲

時間 2019-11-13

標籤校官生成简体版

原文原文鏈接

學習了一篇別人的文章以後，知道了怎麼生成詞雲，因而在原來代碼的基礎上添加了生成詞雲的程序python

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

#讀取文件
file=open('fosu.csv',encoding='utf-8').read()
#結巴分詞
wordlist=jieba.cut(file,cut_all=True)
# print(wordlist)
#去掉空格
# w1=' '.join(wordlist)
# print(w1)
ls=[]
count={}
for w in wordlist:
    ls.append(w)
    if len(w)<=1:
        continue
    else:
        #字典的get方法，若是有這個w，那麼就返回字典中w的值，不然返回0，最終都+1
        count[w]=count.get(w,0)+1
# print(count)
#打印排序後的列表
items=list(count.items())
items.sort(key=lambda x:x[1],reverse=True)
print(items)
#設置背景，大小
wordcloud=WordCloud(
    background_color='white',
    #最多顯示100個詞語
    max_words=300,
    #設置有多少種配色方案
    max_font_size=100,
    height=1000,
    width=1000,
    #設置字體路徑
    font_path='C:\Windows\Fonts\simfang.ttf',
    relative_scaling=0.9
)
#生成詞雲
# myword=wordcloud.generate(count)
#根據詞頻生成詞雲
myword=wordcloud.generate_from_frequencies(count)
#展現詞雲圖
plt.imshow(myword)#默認配置
#axis是用來設置具體某一個座標軸的屬性的,修改xy軸的限制，進行等額遞增
plt.axis('off')
plt.show() #顯示圖像
#保存詞雲圖
wordcloud.to_file('cloud.jpg')

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。