使用Python進行英文詞頻統計

對一篇英文文章進行詞頻統計重點在於內容去噪和歸一化,可用split()進行分詞。本文以《飄》爲例,統計詞頻最高的前十位。web 1.讀取文件,經過lower()、replace()函數將全部單詞統一爲小寫,並用空格替換特殊字符。svg def gettext(): txt = open("piao.txt","r",errors='ignore').read() txt = txt
相關文章
相關標籤/搜索