中文分詞模型算法調研

1. 原理-分詞算法 1.1. 基於詞典的分詞 1、最大匹配分詞算法:尋找最優組合的方式是將匹配到的最長詞組合在一起。其缺點是嚴重依賴詞典,無法很好地處理分詞歧義和未登錄詞。優點是由於這種方法簡單、速度快、且分詞效果基本可以滿足需求,因此在工業界仍然很受歡迎。 2、最短路徑分詞算法:將一句話中的所有詞匹配出來,之後尋找從起始點到終點的最短路徑作爲最佳組合方式 基於Dijkstra算法求解最短路徑、
相關文章
相關標籤/搜索