中文分詞的一些最新研究進展

最近,讀了幾篇這兩年發表的關於分詞的會議論文,發現如今主要的研究方向是解決分詞的領域適用問題,採用的主要模型是已有的分詞算法+訓練集+部分標記語料的半監督學習方式,分詞算法包括感知器、條件隨機場,部分標記的語料主要爲維基百科的漢語語料http://dumps.wikimedia.org/backup-index.html。如今主要介紹一下各文章的關注重點和異同。html 由於水平問題或對論文自己的
相關文章
相關標籤/搜索