數據挖掘:數據預處理相關概念

數據挖掘:數據預處理相關概念 一、什麼是數據預處理? 一般我們得到的數據會存在有缺失值、重複值等,在使用之前需要進行數據預處理。它是一系列對數據操作的統稱。 數據預處理沒有標準的流程,通常針對不同的任務和數據集屬性的不同而不同。數據預處理的常用流程爲: 數據清洗:可以用來清楚數據中的噪聲,糾正不一致。 數據集成:將數據由多個數據源合併成一個一致的數據存儲,如數據倉庫。 數據歸約:可以通過如聚集、刪
相關文章
相關標籤/搜索