【中文分詞】使用IKAnalyzer分詞統計詞頻

一.引入jar包: 二.在src目錄下配置IKAnalyzer.cfg.xml 有需要可以自己擴展詞彙與停止詞 三.根據分詞統計詞頻: 1.傳入參數進行分詞,並統計每個詞的頻率。代碼如下: 2.按詞頻高低排序,代碼如下: 3.整理簡單工具類,代碼如下: 其中IKSegmenter是分詞的主要類,構造函數ture代表只能分詞,改成false則爲最細粒度分詞
相關文章
相關標籤/搜索