樸素貝葉斯和垃圾郵件的故事

1.問題描述 假設我們已經有了一批正常郵件和一批垃圾郵件,郵件裏面的內容我們是可以知道的。然後我們今天收到了一封新郵件,現在要判斷這封新郵件到底是正常郵件還是垃圾郵件??用一個圖表示就是 這是個經典的二分類問題 樸素貝葉斯是如何解決這個問題的呢??, 他的核心思想是:統計,也就是統計正常郵件和垃圾郵件中的各個單詞的個數,對於敏感詞彙如 「鏈接」,那它肯定在垃圾郵件中出現的次數比較多,即 2.一個小
相關文章
相關標籤/搜索