語言模型(Language Modeling)與統計語言模型

1. n-grams 統計語言模型研究的是一個單詞序列出現的概率分佈(probability distribution)。例如對於英語,全體英文單詞構成整個狀態空間(state space)。 邊緣概率分佈 p(Xt=k) 稱爲 unigram; 使用一階馬爾科夫模型(Markov model),則 p(Xt=k|Xt−1=j) 又稱爲 bigram; 類似地,基於二階馬爾科夫模型, p(Xt=k
相關文章
相關標籤/搜索