數據ETL

1. ETL之數據清洗 數據清洗的概念:「數據清洗確保無法辨認的數據不會進入數據倉庫。無法辨認的數據將影響到數據倉庫中通過聯機分析處理(OLAP)、數據挖掘和關鍵績效指標(KPI)所產生的報表。」數據清洗, 是整個數據分析過程中不可缺少的一個環節,其結果質量直接關係到模型效果和最終結論。 在操作中,數據清洗通常會佔據分析過程的50%—80%的時間。所以數據清洗的過程就顯得尤爲重要,在下面的圖上我們
相關文章
相關標籤/搜索