Java詞頻統計算法(使用單詞樹)

許多英語培訓機構(如新東方)都會出幾本「高頻詞彙」的書,主要內容是統計近幾年來各種外語考試中多次出現的高頻詞彙,幫助考生減小須要背的生詞的數量。但這些高頻是如何被統計出來的呢?顯然不會用手工去計算。 假如咱們已經將一篇文章存在一字符串(String)對象中,爲了統計詞彙出現頻率,最簡單直接的作法是另外建一個Map:key是單詞,value是 次數。將文章從頭讀到尾,讀到一個單詞就到Map裏查一下,
相關文章
相關標籤/搜索