數據倉庫模型

數據倉庫模型

層次

數據倉庫模型是數據模型中針對特定的數據倉庫應用系統的一種特定的數據模型,通常來講,數據倉庫模型分爲如下幾個層次,需經歷通常四個過程:前端

業務建模:生成業務模型,主要解決業務層面的分解和程序化數據庫

領域建模:生成領域模型,主要對業務模型進行抽象處理,生成領域概念模型工具

邏輯建模:生成邏輯模型,主要將領域模型的概念實體以及實體之間的關係進行數據庫層次的邏輯化性能

物理建模:生成物理模型,主要解決邏輯模型針對不一樣關係型數據庫的物理化以及性能等一些具體的技術問題。spa

發展

2.1 簡單的報表階段:在該階段,系統的主要目標是解決一些平常的工做中業務人員須要的報表,生成一些簡單的可以幫助領導進行決策所須要的彙總數據。表現形式爲數據庫和前端報表工具設計

2.2 數據集市階段:根據業務部門的須要,進行必定的數據採集和整理,按照業務人員的須要,進行多維報表的展示,提供對特定業務指導的數據幫助領導進行決策對象

2.3 數據倉庫階段:按照數據模型,對整個企業的數據進行採集、整理,按照各個業務部門的須要,提供跨部門的,徹底一致的業務包邊數據,可以經過數據倉庫生成對業務數據具備指導性的數據,同時爲領導決策提供全面的數據支撐。排序

建模方法

1.範式建模法

範式模型法是構建數據模型經常使用的一個方法,該方法主要由Inmon提倡,主要解決關係型數據庫的數據存儲,利用技術層面上的方法。目前在關係型數據庫中的建模方法,大部分採用的是三範式建模法。事件

 

範式是數據庫邏輯模型設計的基本理論,一個關係模型能夠從第一範式到第五可是進行無損分解,這個過程也可稱爲規範化。在數據倉庫的模型設計中目前通常採用第三範式,它有嚴格的數學定義。從其表達的含義來看,一個符合第三範式的關係必須具備如下三個條件:數學

一、每一個屬性值惟一,不具備多義性;

二、每一個非主屬性必須徹底依賴於整個主鍵,而非主鍵的一部分;

三、每一個非主屬性不能依賴於其它關係中的屬性,由於這樣的話,這種屬性應該歸到其它關係中去。

 

範式建模法多應用於業務系統的企業數據模型。企業數據模型分爲兩個層次,及主題域模型和邏輯模型。和數據倉庫的模型稍有不一樣:

一、數據倉庫的域模型的概念應該比業務系統的主題語模型範圍更加廣

二、數據倉庫中的邏輯模型須要從業務系統中的數據模型的邏輯模型中抽象實體,實體的屬性,實體的子類以及實體的關係等。

 

優勢

從關係型數據庫的角度出發,結合了業務系統的數據模型,可以比較方便的實現數據倉庫的建模

缺點

建模方法限制在關係型數據庫之上,在某些時候反而限制了整個數據倉庫模型的靈活性,性能等。

2.維度建模法

維度建模法,Kimball最早提出。最簡單的描述是,按照事實表、維度表來構建數據倉庫,數據集市。這種方法最被人普遍知曉的名字就是星型模式(一張事實表產生多張維度表)。

優勢

針對各個維度作了大量的預處理,若是按照維度進行預先的統計、分類、排序等。經過這些預處理,可以極大的提高數據倉庫的處理能力。

維度建模很是直觀,牢牢圍繞業務模型,能夠直觀的反映出業務模型中的業務問題。不須要通過特別的抽象處理,便可以完成維度建模。

缺點

大量的數據預處理工做。當業務發生變化時須要從新進行維度數據的預處理。這些處理過程當中每每會致使大量的數據冗餘。

只依靠單純的維度建模,不能保證數據來源的一致性和準確性,在數據倉庫底層,不是特別適用於維度建模。

3.實體建模法

來源與哲學流派。咱們能夠將整個業務劃分爲一個個的實體,而每一個實體之間的關係和針對這些關係的說明就是咱們數據建模須要作的工做。

咱們能夠將任何一個業務過程劃分爲3個部分,實體,事件和說明

實體,主要指領域模型中特定的概念主體,指發生業務關係的對象

事件,主要指概念主體之間完成一次業務流程的過程,特指特定的業務過程

說明,主要是針對實體和時間的特殊說明

優勢和缺點

實體說明法只是一種抽象客觀世界的方法,所以,註定了該建模方法只能侷限在業務建模和領域概念建模階段。所以,到了邏輯建模階段和物理建模階段,則是範式建模和維度建模發揮長處的階段。

相關文章
相關標籤/搜索