數據倉庫ETL工具箱——抽取(一)

源數據抽取是數據流主線的第一步,在數據抽取時應抽取什麼樣的數據、利用什麼工具抽取、抽取的指標是什麼、抽取的數據如何交給下游等將在本篇詳細說明。 邏輯數據映射的設計 在物理設計之前必須進行ETL的邏輯映射來確保無法跟蹤數據的情況產生,邏輯數據映射的設計包括一下幾方面: 有一個邏輯數據映射的規劃 確定候選的數據源 使用數據評估工具來分析源系統 接收數據線和業務規則的遍歷 充分理解數據倉庫的數據模型 驗
相關文章
相關標籤/搜索