自然語言處理-中文分詞

一、中文分詞技術 1、常見的兩類中文分詞技術 中文分詞技術常見的有兩大類:機械分詞技術、基於統計的序列標註技術。 機械分詞技術操作簡單、方便,比較省心,但是對於歧義詞以及未登錄詞的效果並不是很好; 統計模型的序列標註方法,對於識別未登錄詞擁有較好的識別能力,而且分詞精度也比較大,同時這個方法可以不分中文、英語,着重看在語言前後順序。 以下是思維導圖的形式展示兩大區別: 2、深度學習在分詞、找詞中的
相關文章
相關標籤/搜索