spss數據的預處理

數據清洗:對獲取的原始數據中的缺失值進行填補,分析數據中是否存在離羣點,對噪聲數據進行平滑等,並利用適當的技術對這些「髒數據」進行清洗,提高數據的質量。 數據集成:將來自不同數據源的數據進行合併,去除可能存在的冗餘數據,保證數據的一致性。 數據變換:對數據進行規範化處理,將數據轉換爲有利於數據挖掘的形式。 數據規約::將數據集轉換爲相對簡單的形式。若需要對離散型數據進行挖掘需要先將連續型數據量化
相關文章
相關標籤/搜索