1.數據調研spa
2.肯定數據範圍接口
須要把上端應用需求與ODS數據範圍進行驗證,以確保應用所需的數據都已經從業務系統中抽取出來,而且獲得了很好的組織,以ER模型表示數據主題關係數據分析
3.根據數據範圍進行進一步的數據分析和主題定義數據
把第一步生成的每一個ER圖中的實體進行分解,分解的結果仍以ER表示爲佳時間
4.定義主題元素生成
定義主題、粒度、維、度量、存儲期限模型
a.定義維的概念特性:
維名稱,名稱應該可以清晰表示出這個維的業務含義。
維成員,也就是這個維所表明的具體的數據,
維層次,維成員之間的隸屬與包含的層次關係,每一個層次須要定義名稱
b.定義度量的概念特性:
度量名稱,名稱應該可以清晰標書這個度量的業務含義
c.定義主題的概念特性:
主題名稱和含義,說明該主題主要包含哪些數據,用於什麼分析;
d.主題所包含的維和度量;
主題的事實表,以及事實表的數據。
e.定義粒度:
主題中事實表的數據粒度說明,這種粒度能夠經過對維的層次限制加以說明,也能夠經過對事實表數據的業務細節程度進行說明。
f. 定義存儲期限:
主題中事實表中的數據存儲週期。主題
5.迭代,歸併維、度量的定義系統
具體的業務代碼所造成的各個維、以及維成員等須要進一步進行歸併,把概念統一的維定義成一個維,不容許同一個維存在不一樣的實體表示
6.物理實現
定義每一個主題的數據抽取週期、抽取時間、抽取方式、數據接口,抽取流程和規則
7.對ODS中的各個主題的事實數據進行時間上的彙總
按照時間維進行彙總,以實現初步的信息沉澱
8.按照業務邏輯的規則,對數據進行歸併
9.把包含細節過多的交易記錄進行拆分
10.彙總、再彙總