Python機器學習 -- 數據預處理(理論)

1、爲何數據須要進行預處理?        數據預處理是數據挖掘的重要一環,要使挖掘方案挖掘出豐富的知識,就必須爲它提供乾淨、準確、簡潔的數據。然而實際應用系統中收集到的原始數據是「髒」的,不徹底的、冗餘的和模糊的,不多能直接知足數據挖掘算法的要求。在海量的實際數據中無心義的成分也不少,嚴重影響了數據挖掘算法的執行效率,其中的噪聲干擾還會形成無效的概括。預處理已經成爲數據挖掘系統實現過程當中的關鍵
相關文章
相關標籤/搜索