分詞工具Hanlp基於感知機的中文分詞框架

  結構化感知機標註框架是一套利用感知機做序列標註任務,並且應用到中文分詞、詞性標註與命名實體識別這三個問題的完整在線學習框架,該框架利用1個算法解決3個問題,時自治同意的系統,同時三個任務順序漸進,構成流水線式的系統。本文先介紹中文分詞框架部分內容。 中文分詞 訓練 只需指定輸入語料的路徑(單文檔時爲文件路徑,多文檔時爲文件夾路徑,靈活處理),以及模型保存位置即可: 命令行 java -cp h
相關文章
相關標籤/搜索