中文句子的詞分割算法:MaxMatch

今天閱讀的時候,發現了一個分割句子中詞語的算法:MaxMatch,這個算法在中文應用中效果很好。 這是一個貪心算法,在指定的字典(dictionary)中查找詞彙並進行句子的分割。 下面是一個應用本算法的例子:Input: 他特別喜歡北京烤鴨 Output: 他 特別 喜歡 北京烤鴨 算法的僞代碼如下: 這個算法在中文的應用中比英文好很多,因爲中文詞彙比英文短。 爲了檢驗詞彙分割的效果,我們可以使
相關文章
相關標籤/搜索