【實戰】詞頻統計及詞雲圖製做

寫在開頭 最近對詞雲有些興趣,就本身瞎琢磨研究一些這方面的知識,期間也遇到一些小問題,寫下此篇文章留做備註吧。html 研究對象 金庸老先生的《天龍八部》python 正式開始(微笑臉) 統計字頻 (1)先統計下小說的字頻數: 天龍八部總共用字量4134個,top20的字不出意外都是一些經常使用詞,不過「一」居然排名第二很讓我意外。 # -*- coding:utf-8 -*- import re
相關文章
相關標籤/搜索