作業提交

說明 1、準備 語言:Python 數據:1998年1月份人民日報語料 2、數據預處理 刪除掉缺少標籤的詞以及空格、空行 將數據隨機分爲5等均份 3、編程實現 任務:詞性標註 方法:隱馬爾維特比算法 利用訓練語料進行訓練,獲得狀態概率轉移矩陣、發射矩陣、初始狀態矩陣。 利用測試語料進行預測詞語的詞性 4、模型驗證 採用十折交叉驗證方法,計算預測結果平均的準確率。 結果
相關文章
相關標籤/搜索