吳軍《數學之美》部分概念筆記(1-11章)

相關參考資料見正文數據庫 Good-turing模型:less 因爲咱們是估算對於一個位置上出現單詞wi的機率。這種狀況下,在樣本庫中沒有出現的單詞,其機率並不是爲0. 但因爲已有的Nr`r的累計和已經達到了1,因此必須採用一個「騰挪「的辦法,將一部分的機率分佈騰挪給未出現的單詞。編碼 解決辦法就是在計算累計出現次數較少的單詞時,將其機率替換爲一個較小的值(此處的辦法是將r替換爲r‘)spa  r
相關文章
相關標籤/搜索