hanlp中的N最短路徑分詞

N-最短路徑 是中科院分詞工具NLPIR進行分詞用到的一個重要算法,張華平、劉羣老師在論文《基於N-最短路徑方法的中文詞語粗分模型》中做了比較詳細的介紹。該算法算法基本思想很簡單,就是給定一待處理字串,根據詞典,找出詞典中所有可能的詞,構造出字串的一個有向無環圖,算出從開始到結束所有路徑中最短的前N條路徑。因爲允許相等長度的路徑並列,故最終的結果集合會大於或等於N。 根據算法思想,當我們拿到一個字
相關文章
相關標籤/搜索