搞數據倉庫這麼久,實踐中發現首先搭建數據集市,仍是清洗數據以後,直接進入數據立方體(造成維度表和實施表)造成核心數據倉庫層,是個選擇題...segmentfault
隨後發現這其實涉及到了數據倉庫的歷史問題,是採用Inmon建模仍是採用Kimball建模?甚至有人稱之爲數據倉庫界的宗教之爭。下面我說一下本身的理解:架構
2000年5月,W.H.Inmon在DM Review雜誌上發表一篇文章,正是揭示了他的企業信息化工廠的特色。下圖是我理解的企業信息化工廠架構圖:.net
數據獲取到以後,先進行整理,而且要求整理的數據是知足第三範式標準的。3d
我理解,Kimball與Inmon的主要區別就是Kimball更強調一致性事實和維度,也就是一致性維度企業總線的總要做用,這樣在數據倉庫迭代開發過程當中更接近需求,也會提高敏捷性。一般,Kimball都是以最終任務爲導向。blog
首先,在獲得數據後須要先作數據的探索,深刻理解業務邏輯與數據表的關係。開發
而後,在明確數據依賴後,按照目標需求,直接生成事實表+維度表。入門
最後,(數據集市層)拆分出部分的事實表和維度表table
結果,數據集市一方面能夠直接向BI環節輸出數據,另外一方面也能夠向數據倉庫層輸出數據,方便後續的多維分析。以下圖:im
他們之間的區別用這個圖表體現很是合適:數據
特性 | Kimball | Inmon |
---|---|---|
時間 | 快速交付 | 路漫漫其修遠兮 |
開發難度 | 小 | 大 |
維護難度 | 大 | 小 |
技能要求 | 入門級 | 專家級 |
數據要求 | 特定業務 | 企業級 |
https://segmentfault.com/a/1190000006255954
http://blog.csdn.net/paicMis/article/details/53236869