最短路徑分詞

最短路徑分詞 中文分詞有很多方法,比如N-最短路徑法,N元語言模型,CRF模型等等。大致可以分爲兩類:一是機械化的分詞,二是用機器學習方法分詞。最短路徑算法可以劃分到第一種。這個算法效果並不是最好的,大體和IK分詞打成平手。今天用最簡潔語言描述一下:這個算法主要分兩步:第一,構造DAG(有向無環圖),第二找出最優路徑。以下圖爲例 "有意見分歧」進行分詞。首先構造下圖中的左邊的DAG:節點用0~5來
相關文章
相關標籤/搜索