漢語分詞初探

基於詞典的分詞 顧名思義,基於詞典的分詞就是要有一個詞典,分詞的過程就是用詞典中的詞和句子中的詞進行比對,然後選出一個最優的切分結果。 顯而易見,基於詞典的分詞必須要維護一個好的詞典,且其無法處理未登錄詞。 最長匹配分詞 最長匹配分詞指的是使用貪婪算法,從前往後匹配,匹配到最長的字串作爲一個詞,這種方法一般稱爲最大正向匹配。 如果是從後往前匹配,也叫做最大反向匹配。 由於漢語組詞的多樣性,使用最大
相關文章
相關標籤/搜索