平滑(smoothing)

1 問題的提出 由於在現實生活中,我們的觀察尺度有限,我們的樣本(輸入)很可能沒有辦法包含所有可能的情況,那麼我們怎麼去處理先前看不見的事件呢? 舉個例子,莎士比亞使用了30000個雙連詞(bigram),然而我們總共有V^2=8.44億個可能的雙連詞,所以,99.96%的可能的雙連詞都沒有出現過,那是不是意味着,任何句子包含有其中某一種雙連詞的概率就爲0呢?同樣的問題有很多,當我們面對的升起問題
相關文章
相關標籤/搜索