數據挖掘複習總結

數據挖掘複習總結 根據老師課件、課本、網絡資料總結,供開卷考試複習使用 第三章-數據預處理 爲什麼要進行數據預處理:P23 因爲髒數據:數據中存在誤差(測量誤差、收集誤差;難以處理)、數據不一致(手工處理、耗時)、噪聲(包含錯誤或孤立點或離羣點;對噪音的處理具有兩面性)、不完整(缺少數據值、缺乏某些重要屬性、僅包含彙總數據)、重複數據、P26數據質量的其他問題(時效性、相關性、採樣合理性) 數據預
相關文章
相關標籤/搜索