爬取學校官網新聞-生成詞雲

學習了一篇別人的文章以後,知道了怎麼生成詞雲,因而在原來代碼的基礎上添加了生成詞雲的程序python

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

#讀取文件
file=open('fosu.csv',encoding='utf-8').read()
#結巴分詞
wordlist=jieba.cut(file,cut_all=True)
# print(wordlist)
#去掉空格
# w1=' '.join(wordlist)
# print(w1)
ls=[]
count={}
for w in wordlist:
    ls.append(w)
    if len(w)<=1:
        continue
    else:
        #字典的get方法,若是有這個w,那麼就返回字典中w的值,不然返回0,最終都+1
        count[w]=count.get(w,0)+1
# print(count)
#打印排序後的列表
items=list(count.items())
items.sort(key=lambda x:x[1],reverse=True)
print(items)
#設置背景,大小
wordcloud=WordCloud(
    background_color='white',
    #最多顯示100個詞語
    max_words=300,
    #設置有多少種配色方案
    max_font_size=100,
    height=1000,
    width=1000,
    #設置字體路徑
    font_path='C:\Windows\Fonts\simfang.ttf',
    relative_scaling=0.9
)
#生成詞雲
# myword=wordcloud.generate(count)
#根據詞頻生成詞雲
myword=wordcloud.generate_from_frequencies(count)
#展現詞雲圖
plt.imshow(myword)#默認配置
#axis是用來設置具體某一個座標軸的屬性的,修改xy軸的限制,進行等額遞增
plt.axis('off')
plt.show() #顯示圖像
#保存詞雲圖
wordcloud.to_file('cloud.jpg')
相關文章
相關標籤/搜索