[數據分析學習筆記] 數據預處理

數據分析學習筆記 —— 數據預處理 數據預處理一方面是要提高數據的質量,另一方面是要讓數據更好地適應特定的挖掘技術或工具。 數據預處理的主要內容包括:數據清洗、數據集成、數據變換和數據規約。 知識點總結如下圖所示: 數據預處理的主要過程  數據清洗:主要是刪除原始數據集中的無關數據、重複數據,平滑噪聲數據,篩選掉與挖掘主題無關的數據,處理缺失值、異常值等。 數據集成:將多個數據源合併存放在一個一致
相關文章
相關標籤/搜索