Hanlp等七種優秀的開源中文分詞庫推薦

中文分詞是中文文本處理的基礎步驟,也是中文人機自然語言交互的基礎模塊。由於中文句子中沒有詞的界限,因此在進行中文自然語言處理時,通常需要先進行分詞。 縱觀整個開源領域,陸陸續續做中文分詞的也有不少,不過目前仍在維護的且質量較高的並不多。下面整理了一些個人認爲比較優秀的中文分詞庫,以供大家參考使用。 1、HanLP —— 漢語言處理包 HanLP是一系列模型與算法組成的NLP工具包,由大快搜索主導並
相關文章
相關標籤/搜索