數據預處理_數據清理

一、概述前端 實際的數據庫極易受噪聲、缺失值和不一致數據的侵擾,由於數據庫太大,而且多半來自多個異種數據源。低質量的數據將會致使低質量的挖掘結果。有大量的數據預處理技術: - - 數據清理:能夠用來清楚數據中的噪聲,糾正不一致。 - - 數據集成:將數據由多個數據源合併成一個一致的數據存儲,如數據倉庫。 - - 數據歸約:能夠經過如彙集、刪除冗餘特徵或聚類來下降數據的規模。 - - 數據變換:(例
相關文章
相關標籤/搜索