走進大數據丨 ETL – 數據清洗過程

我們已經對數據清洗有了一定概念:「數據清洗確保無法辨認的數據不會進入數據倉庫。無法辨認的數據將影響到數據倉庫中通過聯機分析處理(OLAP)、數據挖掘和關鍵績效指標(KPI)所產生的報表。」數據清洗, 是整個數據分析過程中不可缺少的一個環節,其結果質量直接關係到模型效果和最終結論。 在實際操作中,數據清洗通常會佔據分析過程的50%—80%的時間。所以數據清洗的過程就顯得尤爲重要,在下面的圖上我們可以
相關文章
相關標籤/搜索