【機器學習課程-華盛頓大學】:3 分類 3.4(2) 決策樹處理丟失數據

1、丟失數據處理方法:丟棄 (1)丟棄缺失的數據點:這種方法要保證丟失的數據點不要太多,否則刪除的太多   (2)丟棄缺失的特徵:這種方法要保證丟失的特徵點不要太多   優點:容易理解;容易在各種模型中實現 缺點:丟失數據將造成信息丟失;無法權衡到底是丟棄特徵還是數據點;當預測數據也有丟失的時候,很難預測;   2、丟失數據處理方法:填充 (1)填充自己計算出現的值:最常出現的值,均值,中值等。
相關文章
相關標籤/搜索