數據預處理——數據清洗

在數據挖掘中,海量的原始數據中存在着大量不完整、不一致、有異常的數據,嚴重影響到數據挖掘建模的執行效率,甚至可能致使挖掘結果的誤差,因此進行數據清洗就顯得尤其重要,數據清洗完成後接着進行或者同時進行數據集成、變換、規約等一系列的處理,該過程就是數據預處理。git 數據預處理一方面是要提升數據的質量,另外一方面是要讓數據更好地適應特定的挖掘技術或工具。github 數據預處理的主要內容包括數據清洗、
相關文章
相關標籤/搜索