讀《python數據挖掘與分析實戰》之四

數據預處理 在數據挖掘中,海量的原始數據中存在着大量不完整,不一致,有異常的數據,嚴重影響到數據挖掘建模的執行效率,甚至可能導致挖掘結果的偏差,所以進行數據清洗就顯得尤爲重要,數據清洗完成後接着進行或者同時進行數據集成,轉換,規約等一系列的處理,該過程就是數據預處理。數據預處理一方面是要提高數據的質量,另一方面是要讓數據更好地適應特定的挖掘技術或者工具。 數據預處理的主要內容包括數據清洗,數據集成
相關文章
相關標籤/搜索