數據分析之數據預處理

數據預處理步驟及方法 一、缺失值處理 1.一、形成缺失值緣由 缺失值處理原則: 使用最可能的值代替缺失值,使缺失值與其餘數值之間的關係保持最大。 缺失值處理的方法不少,好比刪除記錄、均值填充、中位數填充等,具體方法如表1所示。 二、異常值處理 異常值是數據集中偏離大部分數據的數據。從數據值上表現爲:數據集中與平均值的誤差 超過兩倍標準差 的數據,其中與平均值的誤差超過三倍標準差的數據,稱爲高度異常
相關文章
相關標籤/搜索