【數據挖掘筆記三】數據預處理

  3.數據預處理 數據預處理技術:算法 數據清理用來清除數據中的噪聲,糾正不一致;數據庫 數據集成將數據由多個數據源合併成一個一致的數據存儲,如數據倉庫;網絡 數據歸約經過如彙集、刪除冗餘特徵或聚類來下降數據的規模;數據結構 數據變換(如規範化)把數據壓縮到較小的區間,如[0,1],能夠提升涉及距離度量的挖掘算法的準確率和效率。函數 3.1數據預處理:概述 數據質量的三要素:準確性、完整性和一致
相關文章
相關標籤/搜索