詞性標註（pos tagging）

時間 2020-12-30

標籤自然語言處理简体版

原文原文鏈接

1 貝葉斯公式+維特比算法準備工作 1 詞性矩陣A NW; N詞性的大小，W詞表的大小根據數據統計得到每個詞的詞性出現的頻率，再按照單詞做歸一化還可以做一下數據平滑。 2 pai 每個詞性出現在第一個位置的概率 3 狀態轉移矩陣:出現詞性1的下一個爲詞性2B的概率 NN 維特比算法每個單詞處，保留概率最大的K個路徑 T*N,T輸入的長度先算第一個單詞的情況。如下的W1 再依次根據上一個的

>>阅读原文<<