數據預處理_數據清理(缺失值、噪聲等詳細處理)

1、概述 實際的數據庫極易受噪聲、缺失值和不一致數據的侵擾,因爲數據庫太大,並且多半來自多個異種數據源。低質量的數據將會導致低質量的挖掘結果。有大量的數據預處理技術: - - 數據清理:可以用來清楚數據中的噪聲,糾正不一致。  - - 數據集成:將數據由多個數據源合併成一個一致的數據存儲,如數據倉庫。  - - 數據歸約:可以通過如聚集、刪除冗餘特徵或聚類來降低數據的規模。  - - 數據變換:(
相關文章
相關標籤/搜索