基於可複用構件思想的ETL架構設計

數據倉庫的數據來源常包含着噪聲數據、不完整數據、甚至是不一致的數據。爲了得到高質量的數據,必須對抽取(Extract)出來的原始數據做一系 列複雜轉換(Transform)處理,最後裝載(Load)到數據倉庫中。這種從原始數據到數據倉庫之間,對數據進行的操作稱爲ETL過程,其工作量大 約佔系統的60%,實現ETL過程的效率和質量很大程度上決定了數據倉庫系統的構建效率和質量。目前研究ETL過程都是集
相關文章
相關標籤/搜索