統計語言模型

1. 統計語言模型 句子 W=wT1=(w1,w2,⋯,wT),wT1 表示句子的第一個詞語到第T個詞語。 P(W)=P(wT1)=P(w1,w2,⋯,wT)=P(w1)×P(w2|w1)×P(w3|w21)×⋯×P(wT|wT1) 句子長度爲 T,詞典 D 的大小爲 N ,存在 NT 種句子,每個句子需要 T 個參數,共 T×NT 個參數(其中有重複的)。 下面討論兩種計算參數的方法:n-gra
相關文章
相關標籤/搜索