DW(Data Warehouse),除去「存放數據的倉庫」的概念,數據倉庫是一種資料儲存理論,面對各類資料,將它們經過特定的方式儲存起來,儲存方式要特別利於對資料進行分析和處理,並最終作出決策。sql
區別於強調實時和事物的業務數據庫,DW裏的數據,通常都不會隨時間發生變更,大部分都是歷史性資料。數據庫
這種理論下,DW的核心就是儲存方式和分析方式。架構
Online Analytical Process,聯機分析處理,以多維度的方式分析數據,是最多見的理解。框架
Online Transaction Processing,鏈接交易處理,更側重於事務處理,核心是ACID,包括數據庫的增刪改查。函數
Business Intelligence,商務智能,指從數據存儲、分析、挖掘、展示等一條龍,最終實現商業價值。工具
Dimension,Measure,數據分析中兩個基本概念。大數據
維度是指審視數據的角度,一般指數據記錄的一個屬性。度量指基於數據計算出來的考量值,在sql中,where
,group by
的屬性一般就是維度,經過聚合函數計算的屬性一般是度量。code
select name, age, avg(score) from student group by age
事件
上面的查詢中,age
就是維度,score
度量。圖片
Fact Table,事實表,指存儲事實記錄的表,通常是字段超多的大表,如銷售記錄,明細等。
Dimension Table,維度表,與事實表相反,只保存了維度的屬性值,能夠和事實表作關聯。
維度表至關於從事實表中抽取出常常重複的屬性,並規範成一張表,常見的有日期表,地點表,Avaya的DM_AGENTS
等DM_*表。
使用維度表的好處:
Star Schema,數據挖掘常見的一種多爲數據模型。
星型模型中只有一張事實表,多個維度表,經過主外鍵相關聯,就像好多星星圍繞在一個恆星周圍。。
若是對維度表再作抽取規範,維度表之間也進行關聯,則成爲更復雜的雪花模型。
Avaya Insights共有八張維度表,七張事實表,僅有兩張維度表相關聯,各維度表被事實表複用,至關因而一個星型模型。
從維度屬性來看,爲帳戶、時間、坐席、組。
Oceanalytics是Avaya的大數據中心,Insights是其中的報表框架,本質上是深度依賴於Oracle的架構。
從文檔裏簡單的描述來看,對數據的處理主要步驟以下:
具體的事件處理器,處理引擎,還有Oracle的各類工具,就不得其解了,太商業了。