java tf-idf提取關鍵字

最近在研究nlp,nlp第一步就是分詞,目前開源的工具中,java的有中科院的分詞工具nlpir、還有word分詞器,ansj_seg等,python的比較火的jieba,ansj_seg5.x版本以後提供了提取關鍵字的方法,jieba也提供了提取關鍵字的方法。 提取關鍵字比較經常使用的算法有tf-idf、textrank。其中tf-idf是統計詞頻和逆文檔詞頻,textrank是基於pagera
相關文章
相關標籤/搜索