srilm語言模型中的平滑算法——Good-Turing平滑算法

最近使用使用python自己寫的語言模型和srilm得到的語言模型做對比,srilm裏還是有很多trick的,尤其是平滑算法,集成了很多數據平滑算法,研究的時候,記錄一下。 在srilm中有回退和差值兩類平滑算法,簡單來說,回退就是將出現過的ngram的概率打個折扣,將那部分折扣下來的概率均攤爲未出現的ngram作爲他們的概率,而插值呢,一樣是對出現過的ngram打折扣,但是折扣下來的概率值均攤到
相關文章
相關標籤/搜索