物聯網數據分析與挖掘

數據預處理與知識發現 爲什麼要進行數據預處理? 因爲在現實生活中存在着大量的「髒」數據 數據不完整的性 數據有噪音數據 數據不一致性 技術主要四種:數據清理,數據集成,數據變換,數據歸約 數據清洗: 主要刪去數據中的重複數據,消除數據中的噪音數據,糾正不完整和不一致的數據 噪聲數據是指數據中存在着錯誤或異常(偏離期望值)的數據; 不完整數據是指數據中缺乏某些屬性值: 不一致數據則是指數據內涵出現不
相關文章
相關標籤/搜索