中文分詞發展進程回顧提綱

1、基於詞典的方法 1 正向最大匹配算法 1.從左向右取待切分漢語句的m個字符做爲匹配字段,m爲大機器詞典中最長詞條個數。web 2.查找大機器詞典並進行匹配。若匹配成功,則將這個匹配字段做爲一個詞切分出來。算法 若匹配不成功,則將這個匹配字段的最後一個字去掉,剩下的字符串做爲新的匹配字段,進行再次匹配,重複以上過程,直到切分出全部詞爲止。網絡 流程以下: 機器學習 2 逆向最大匹配算法 該算法是
相關文章
相關標籤/搜索