【數據挖掘筆記三】數據預處理

  3.數據預處理 數據預處理技術: 數據清理用來清除數據中的噪聲,糾正不一致; 數據集成將數據由多個數據源合併成一個一致的數據存儲,如數據倉庫; 數據歸約通過如聚集、刪除冗餘特徵或聚類來降低數據的規模; 數據變換(如規範化)把數據壓縮到較小的區間,如[0,1],可以提高涉及距離度量的挖掘算法的準確率和效率。 3.1數據預處理:概述 數據質量的三要素:準確性、完整性和一致性。然而,現實世界的大型數
相關文章
相關標籤/搜索