數據挖掘 第三章 第四章 :數據預處理的主要任務+數據規範化的方法+數據倉庫OLAP

一、數據預處理的主要任務: (1)數據清理:通過填寫缺失的值、光滑噪聲數據、識別和刪除離羣點等方法去除數據中的噪聲數據和無關數據,並且處理遺漏的數據和清洗「髒」數據,考慮時間順序和數據變化等。數據清理主要針對缺失值的數據處理,並完成數據類型的轉換。 (2)數據集成:當需要分析挖掘的數據來自多個數據源時,就需要集成多個數據庫、數據立方體或文件,即數據集成。 (3)數據歸約:就是指對數據集進行簡化表示
相關文章
相關標籤/搜索