數據挖掘 之 數據預處理

在數據挖掘中,原始數據存在大量不完整、有異常的數據,嚴重影響建模的執行效率,甚至會導致結果偏差,因此非常有必要進行數據清洗,數據清洗完成後接着或同時進行數據集成、轉換、規約等一系列處理,這個過程就是數據預處理。 總而言之,數據預處理的主要內容包括數據清洗、數據集成、數據變換和數據規約。 一、數據清洗 數據清洗主要是刪除原始數據集中的無關數據、重複數據,平滑噪聲數據,篩選掉與挖掘主題無關的數據,處理
相關文章
相關標籤/搜索