命名實體識別_利用CRF_CodingPark編程公園

文章介紹 本文主要講解 原始語料庫 -> 語料清洗 -> 語料分割 -> 構建訓練和測試數據 -> CRF++訓練 -> 命名實體檢索 -> 模型評估html 完整項目 原始語料庫 以人民日報1998年01月語料庫爲例子 python 語料清洗 (1)將語料全角字符(SBC)統一轉爲半角(DBC) (2)三空格變雙空格 標註和標註之間的間隔規定爲雙空格,可是會存在一些三空格 (3)單空格變爲雙空格
相關文章
相關標籤/搜索