數據倉庫ETL工具箱——清洗和規範化

在ETL系統中,數據的抽取和加載只是改變了數據的格式和數據的位置,而真正改變數據價值的恰恰是清洗和規範化的步驟,這對於數據能否用於預期目標起了決定性的作用。清洗和規範化包含三個重要的可提交內容: 數據評估報告 錯誤事件事實表 審計維 關於數據評估報告主要針對的是數據質量,數據質量應該保證數據的精確性,精確的數據意味着: 正確的:數據的值正確 明確的:數據值的描述清晰 一致的:固定標識,相同值的描述
相關文章
相關標籤/搜索