自然語言處理期末複習(2)中文分詞

1.漢語分詞:通過計算機程序把組成漢語文本的字串自動轉換 爲詞串的過程被稱爲自動切分 2.漢語切分的原因:(1)語音的合成(2)信息檢索(3)詞語計量分析 3.漢語分詞基本方法:(1)基於詞表的方法(2)字序列標記方法 4.最大匹配法: (1)  正向最大匹配法(MM) 從左向右匹配詞表 (2)  逆向最大匹配法(RMM) 從右向左匹配詞表 5.歧義的類型 (1)交集型歧義:AJ/B、A/JB 交
相關文章
相關標籤/搜索