數據挖掘--數據預處理

數據預處理方法小結 根據自己的經驗,總結了一下使用過的數據預處理的方法和小技巧。在進行數據分析的時候,工作量最大也最複雜的地方就是對數據進行預處理,一般分爲四個步驟:數據清理、數據集成、數據變換、數據歸約。 一、數據清理(缺失值、異常值、無關值、噪音、重複值) 缺失值:1、刪除:數量較少,對整體數據沒什麼影響的直接刪除該條數據。2、對缺失數據插補:方法較多,例如用該屬性的均值、衆數、中位數插補,這
相關文章
相關標籤/搜索