樸素貝葉斯(二)實現NBCorpus分類(附代碼和數據)

理論可參考 :樸素貝葉斯(一)python 公式:(P(x)爲常數,可忽略不考慮)算法 平滑:測試 Nyk是類別爲yk的樣本個數,n是特徵的維數,Nyk,xi是類別爲yk的樣本中,第i維特徵的值是xi的樣本個數,α是平滑值。atom 在對NBCorpus詞分類時,帶入上面的公式可得:spa 某詞屬於某類別的機率 = (該類別該詞的個數  + 1/ 該類別詞的總數 + 全部類別全部不重複單詞總數)
相關文章
相關標籤/搜索