自然語言處理(九)——數據平滑

一、概念 什麼是數據平滑?我通過一個例子來解釋一下。假設有如下語料庫: {   今天 天氣 不錯,   天氣 晴朗,   晴朗 的 天氣, } 如果要計算句子s=「晴朗天氣」的概率(用二元語法模型,自然語言處理(七)已經介紹過),有如下計算過程。 p(天氣 | 晴朗)  = c(晴朗天氣)/ c(晴朗)  =  = 0 顯然上面計算得到的概率不怎麼準確,晴朗天氣總有出現的可能,最起碼概率應該大於0
相關文章
相關標籤/搜索