MMSEG分詞算法

一、分詞方法 關於中文分詞 參考之前寫的jieba分詞源碼分析 jieba中文分詞。  中文分詞算法大概分爲兩大類: 一是基於字符串匹配,即掃描字符串,使用如正向/逆向最大匹配,最小切分等策略(俗稱基於詞典的)  基於詞典的分詞算法比較常見,比如正向/逆向最大匹配,最小切分(使一句話中的詞語數量最少)等。具體使用的時候,通常是多種算法合用,或者一種爲主、多種爲輔,同時還會加入詞性、詞頻等屬性來輔助
相關文章
相關標籤/搜索