示例:從疝氣病症預測病馬的死亡率

準備數據:處理數據中的缺失值 當數據丟失時,給出了一些方法來解決這個問題。 一、使用可用特徵的均值來填補缺失值; 二、使用特殊值來填補缺失值,如-1; 三、忽略有缺失值的樣本; 四、使用類似樣本的均值填補缺失值; 五、使用另外的機器學習算法預測缺失值。 在預處理階段作兩件事: 第一,全部的缺失值必須用一個實數值來替代,由於咱們使用Numpy數據類型不容許包含缺失值。這裏選擇實數0來替換全部缺失值,
相關文章
相關標籤/搜索