中文詞頻統計

時間 2021-01-13

原文原文鏈接

下載一長篇中文文章。從文件讀取待分析文本。 news = open('gzccnews.txt','r',encoding = 'utf-8') 安裝與使用jieba進行中文分詞。 pip install jieba import jieba list(jieba.lcut(news)) 生成詞頻統計排序排除語法型詞彙，代詞、冠詞、連詞輸出詞頻最大TOP20 將代碼與運行結果截圖發佈在

>>阅读原文<<