中文分詞的原理——正、逆向最大長度匹配法、處理未登錄字符串(JAVA)

中文分詞的原理——正、逆向最大長度匹配法、處理未登錄字符串(JAVA) 中文分詞就是對中文斷句,這樣能消除文字的部分歧義。除了基本的分詞功能,爲了消除歧義還可以進行更多的加工。中文分詞可以分成如下幾個子任務: 分詞:把輸入的標題或者文本內容等分成詞。 詞性標註(POS):給分出來的詞標註上名詞或動詞等詞性。詞性標註可以部分消除詞的歧義,例如「行」作爲量詞和作爲形容詞表示的意思不一樣。 語義標註:把
相關文章
相關標籤/搜索