中文信息處理之最大正向匹配法的評價程序改進

一、背景 昨天寫的最大正向匹配法的評價程序存在如下問題:一個句子使用自己的分詞方法分詞,結果裏邊有些詞彙判斷是對的,但實際上是錯的。如下: s = 「山西山東都有西山煤電」 s1 = 「山西山東」 分出一個【西山】 s2 = 「西山煤電」 分出一個【西山】 s1 結果顯然是錯的,但是我們可能劃到正確的範圍中 二、改進方案 通過初始索引和切分的字符長度來判斷分割是否正確。 輸入:嚴守一把手機關了 輸
相關文章
相關標籤/搜索