學習筆記(三)數據預處理之數據清理

數據預處理算法 1概述。爲了提升數據的質量,數據質量涉及準確性、完整性、一致性、時效性、可信性(反應多少數據是用戶信賴的)和可解釋性(反映數據是否容易理解)。數據預處理的主要步驟:數據清理、數據集成、數據歸約和數據變換。數據庫 數據清理:例程經過填寫缺失的值,光滑噪聲數據、識別或刪除離羣點,並解決不一致性來「清理」數據。數據集成:集成多個數據庫、數據立方體或文件。數據歸約:獲得數據的簡化表示,它小
相關文章
相關標籤/搜索