數據預處理

1.數據質量分析 數據質量分析是數據預處理的前提,其主要任務是檢查原始數據中心是否存在髒數據,髒數據一般指不符合要求以及不能直接進行相應分析的數據。髒數據包含以下內容: 1)缺失值 2)異常值 3)不一致值 4)重複數據以及含有特殊符號(如#、¥、*)的數據 2.數據特徵分析 數據特徵分析要求我麼在數據挖掘建模之前,通過頻率分佈、對比分析、帕累託分析、週期性分析、相關性分析等方法對採集的樣本數據的
相關文章
相關標籤/搜索