Python之文本詞頻統計

本人近期學習了一下關於利用Python統計統計中英文文本詞頻的應用,故記錄一下。 在一篇中英文文本中,有些詞總會重複出現,此次要做的工作就是分別統計中英文文本中的詞頻,英文文本以哈姆雷特劇本爲文本,中文文本以三國演義爲文本。 1、英文文本 英文文本如圖: 對於英文文本來說,有幾個問題需要考慮,首先是文本中出現的各種符號,在英文中出現的各類符號此處採用的處理方式爲均用空格代替,其次是字母大小寫問題,
相關文章
相關標籤/搜索