簡單的樸素貝葉斯算法應用於一個簡單的數據

樸素貝葉斯在一些情況下分類效果還是不錯的,一般常用於文本分析,如垃圾郵件分類等。 本文不介紹樸素貝葉斯算法的理論部分,直接給出一個數據集的案例分析。 數據集由幾個醫學預測變量和一個目標變量組成Outcome。預測變量包括患者的懷孕次數,BMI,胰島素水平,年齡等。 數據集的目的是基於數據集中包括的某些診斷測量來診斷性地預測患者是否患有糖尿病。從較大的數據庫中選擇這些實例存在一些限制。特別是,這裏的
相關文章
相關標籤/搜索