NLP task2 _ 自然語言處理中N-Gram模型的Smoothing算法

使用N-Gram模型時的數據平滑算法 背景:爲什麼要做平滑處理?   零概率問題,就是在計算實例的概率時,如果某個量x,在觀察樣本庫(訓練集)中沒有出現過,會導致整個實例的概率結果是0。在文本分類的問題中,當一個詞語沒有在訓練樣本中出現,該詞語調概率爲0,使用連乘計算文本出現概率時也爲0。這是不合理的,不能因爲一個事件沒有觀察到就武斷的認爲該事件的概率是0。 平滑技術 平滑技術是爲了解決訓練集的數
相關文章
相關標籤/搜索