詞性標註(pos tagging)

1 貝葉斯公式+維特比算法 準備工作 1 詞性矩陣A NW; N詞性的大小,W詞表的大小 根據數據統計得到每個詞的詞性出現的頻率,再按照單詞做歸一化 還可以做一下數據平滑。 2 pai 每個詞性出現在第一個位置的概率 3 狀態轉移矩陣:出現詞性1的下一個爲詞性2B的概率 NN 維特比算法 每個單詞處,保留概率最大的K個路徑 T*N,T輸入的長度 先算第一個單詞的情況。如下的W1 再依次根據上一個的
相關文章
相關標籤/搜索