數據倉庫搭建——Inmon與Kimball

1、簡介

1.1 歷史

搞數據倉庫這麼久,實踐中發現首先搭建數據集市,仍是清洗數據以後,直接進入數據立方體(造成維度表和實施表)造成核心數據倉庫層,是個選擇題...segmentfault

隨後發現這其實涉及到了數據倉庫的歷史問題,是採用Inmon建模仍是採用Kimball建模?甚至有人稱之爲數據倉庫界的宗教之爭。下面我說一下本身的理解:架構

1.2 Inmon

2000年5月,W.H.Inmon在DM Review雜誌上發表一篇文章,正是揭示了他的企業信息化工廠的特色。下圖是我理解的企業信息化工廠架構圖:.net

數據獲取到以後,先進行整理,而且要求整理的數據是知足第三範式標準的。3d

1.3 Kimball

我理解,Kimball與Inmon的主要區別就是Kimball更強調一致性事實和維度,也就是一致性維度企業總線的總要做用,這樣在數據倉庫迭代開發過程當中更接近需求,也會提高敏捷性。一般,Kimball都是以最終任務爲導向。blog

首先,在獲得數據後須要先作數據的探索,深刻理解業務邏輯與數據表的關係。開發

而後,在明確數據依賴後,按照目標需求,直接生成事實表+維度表。入門

最後,(數據集市層)拆分出部分的事實表和維度表table

結果,數據集市一方面能夠直接向BI環節輸出數據,另外一方面也能夠向數據倉庫層輸出數據,方便後續的多維分析。以下圖:im

2、特色

他們之間的區別用這個圖表體現很是合適:數據

特性 Kimball Inmon
時間 快速交付 路漫漫其修遠兮
開發難度
維護難度
技能要求 入門級 專家級
數據要求 特定業務 企業級

 

3、參考文獻

https://segmentfault.com/a/1190000006255954

http://blog.csdn.net/paicMis/article/details/53236869

相關文章
相關標籤/搜索