機器學習缺失值處理方法彙總

1. 用平均值、中值、分位數、衆數、隨機值等替代。效果通常,由於等於人爲增長了噪聲。html 2. 用其餘變量作預測模型來算出缺失變量。效果比方法1略好。有一個根本缺陷,若是其餘變量和缺失變量無關,則預測的結果無心義。若是預測結果至關準確,則又說明這個變量是不必加入建模的。通常狀況下,介於二者之間。網絡 3. 最精確的作法,把變量映射到高維空間。好比性別,有男、女、缺失三種狀況,則映射成3個變量:
相關文章
相關標籤/搜索