數據挖掘複習筆記---04.3分類問題之 Naive Bayes

分類問題之 Naive Bayesspa

簡介

  • 條件機率code

    P(A|B)*P(B) = P(A, B) = P(B|A)*P(A)


  • 全機率公式

    Law_of_total_probability


  • 分類步驟ip

    樸素貝葉斯假設特徵之間相互獨立
    1.計算 P(A|C0) = P(A1, A2, A3|C0) = P(A1|C0) * P(A2|C0) * P(A3|C0)
    2.計算 P(A|C1) = P(A1, A2, A3|C1) = P(A1|C1) * P(A2|C1) * P(A3|C1)
    3.計算 P(A, C0) = P(A|C0) * P(C0)
    4.計算 P(A, C1) = P(A|C1) * P(C1)
    5.不須要計算分母的 P(A)
    6.若是 P(A, C0) > P(A, C1), 那麼能夠得出 P(C0|A) > P(C1|A), 即樣例屬於 C0 類

    clipboard.png


優缺點

  • 抗噪,對孤立噪點噪聲魯棒
  • 對不相關的屬性有較強的魯棒性
  • 若是某條記錄存在缺失值, 之間忽略便可
  • 樸素貝葉斯假設特徵之間相互獨立,但實際狀況並不必定如此
相關文章
相關標籤/搜索