數據倉庫專題(2)-Kimball維度建模四步驟

1、前言設計

  四步過程維度建模由Kimball提出,能夠作爲業務梳理、數據梳理後進行多維數據模型設計的指導流程,可是不能做爲數據倉庫系統建設的指導流程。本文就相關流程及核心問題進行解讀。blog

2、數據倉庫建設流程團隊協作

  如下流程是根據業務系統、組織結構、團隊結構現狀設定的數據倉庫系統建設流程,適合系統結構複雜,團隊協做複雜,人員結構複雜的狀況,而且數據倉庫建設團隊和業務系統建設團隊不一樣的狀況。具體流程以下圖所示:請求

 

圖1 數據倉庫系統建設流程im

 

3、四步維度建模數據

  Kimball四步建模流程適合上述數據倉庫系統建設流程中模型設計環節,重點解決數據粒度、維度設計和事實表設計問題。四步建模流程以下圖所示:客戶端

3、流程解讀項目

  3.1 如何肯定粒度margin

    最細粒度和聚合粒度之爭?留給你們來辯駁吧,你們能夠在評論中發表各自的觀點。img

  3.1 如何標識維度

    標識維度解決的是業務人員如何描述來自業務過程的數據,維度用來表示「誰、什麼、什麼時候、何處、爲什麼、如何」的問題。以競價廣告檢索流程而言就是客戶經過什麼渠道、什麼樣的客戶端(OS、IP)、檢索了什麼樣的內容、請求最終有誰受理等。

  3.2 如何標識事實

    標識事實實際上是在肯定業務過程的度量指標,指標何來?哪些指標必須保留,那些指標必須刪除,待定指標如何處理?必須綜合考慮業務用戶需求和現實數據的實際狀況。事實表的設計徹底依賴於物理活動,不受可能產生的最終報表的影響,報表只是事實表設計的參考視角。

4、未完待續

  數據倉庫專題做爲項目筆記,持續更新中,敬請關注。

相關文章
相關標籤/搜索