《數據挖掘概念與技術》書記 3

數據預處理 歡迎來到現實世界! 數據預處理技術: 數據清理:用來清除數據中的噪聲,糾正不一致。 數據集成:將數據由多個數據源合併成一個一致的數據存儲,如數據倉庫。 數據規約:通過如聚集、刪除冗餘特徵或聚類來降低數據的規模。 數據變換:可以用來把數據壓縮到較小的區間。 這些技術不是互相排斥的,可以一起使用。數據清理可能涉及糾正錯誤數據的變換。 數據質量 數據質量包括準確性、完整性、一致性、時效性、可
相關文章
相關標籤/搜索