HanLP vs LTP 分詞功能測試

文章摘自github,本次測試選用 HanLP 1.6.0 , LTP 3.4.0 測試思路 使用同一份語料訓練兩個分詞庫,同一份測試數據測試兩個分詞庫的性能。   語料庫選取1998年01月的人民日報語料庫。199801人民日報語料   該詞庫帶有詞性標註,爲了遵循LTP的訓練數據集格式,需要處理掉詞性標註。   測試數據選擇SIGHan2005提供的開放測試集。   SIGHan2005的使用
相關文章
相關標籤/搜索