《機器學習實戰中》區分垃圾郵寄的思路整理

樸素貝葉斯算法 原書注重實戰,可是想要透徹理解很麻煩,這裏把大體的流程和模型給出來,但願對你們有幫助,也是我思路的整理 先上貝葉斯公式:p(y|x)=(p(x|y)P(y))/p(x) 優勢:在數據量較少時候依然有效 缺點:對數據的輸入格式有嚴格的標準,適用於標稱數據 要求特徵值相對獨立 算法核心思想:假設如今給你一篇文章:屬於A類的機率是P(A), 屬於B類的機率是P(B),若P(A)>P(B)
相關文章
相關標籤/搜索