正向最大匹配中文分詞算法

中文分詞一直都是中文自然語言處理領域的基礎研究。目前,網絡上流行的很多中文分詞軟件都可以在付出較少的代價的同時,具備較高的正確率。而且不少中文分詞軟件支持Lucene擴展。但不管實現如何,目前而言的分詞系統絕大多數都是基於中文詞典的匹配算法。   在這裏我想介紹一下中文分詞的一個最基礎算法:最大匹配算法 (Maximum Matching,以下簡稱MM算法) 。MM算法有兩種:一種正向最大匹配,一
相關文章
相關標籤/搜索