Kylin基本概念

基本概念

數據倉庫

DW(Data Warehouse),除去「存放數據的倉庫」的概念,數據倉庫是一種資料儲存理論,面對各類資料,將它們經過特定的方式儲存起來,儲存方式要特別利於對資料進行分析和處理,並最終作出決策sql

區別於強調實時和事物的業務數據庫,DW裏的數據,通常都不會隨時間發生變更,大部分都是歷史性資料。數據庫

這種理論下,DW的核心就是儲存方式和分析方式。架構

OLAP

Online Analytical Process,聯機分析處理,以多維度的方式分析數據,是最多見的理解。框架

OLTP

Online Transaction Processing,鏈接交易處理,更側重於事務處理,核心是ACID,包括數據庫的增刪改查。函數

BI

Business Intelligence,商務智能,指從數據存儲、分析、挖掘、展示等一條龍,最終實現商業價值。工具

維度和度量

Dimension,Measure,數據分析中兩個基本概念。大數據

維度是指審視數據的角度,一般指數據記錄的一個屬性。度量指基於數據計算出來的考量值,在sql中,where,group by的屬性一般就是維度,經過聚合函數計算的屬性一般是度量。code

select name, age, avg(score) from student group by age事件

上面的查詢中,age就是維度,score度量。圖片

事實表和維度表

Fact Table,事實表,指存儲事實記錄的表,通常是字段超多的大表,如銷售記錄,明細等。

Dimension Table,維度表,與事實表相反,只保存了維度的屬性值,能夠和事實表作關聯。

維度表至關於從事實表中抽取出常常重複的屬性,並規範成一張表,常見的有日期表,地點表,Avaya的DM_AGENTS等DM_*表。

使用維度表的好處:

  1. 縮小事實表的大小
  2. 便於維護維度,增刪改維度,如名字,不須要動巨大的事實表
  3. 可被多個事實表重用

星型模型

Star Schema,數據挖掘常見的一種多爲數據模型。

星型模型中只有一張事實表,多個維度表,經過主外鍵相關聯,就像好多星星圍繞在一個恆星周圍。。

若是對維度表再作抽取規範,維度表之間也進行關聯,則成爲更復雜的雪花模型。

Avaya Insights共有八張維度表,七張事實表,僅有兩張維度表相關聯,各維度表被事實表複用,至關因而一個星型模型。

輸入圖片說明

從維度屬性來看,爲帳戶、時間、坐席、組。

Avaya報表

Oceanalytics是Avaya的大數據中心,Insights是其中的報表框架,本質上是深度依賴於Oracle的架構。

從文檔裏簡單的描述來看,對數據的處理主要步驟以下:

  1. 事件處理器收到事件,並經過JMS發佈消息
  2. 客戶拿到消息,根據維度,本身統計度量值
  3. 處理引擎拿到消息,經過Oracle BAM生成實時報表
  4. 同時,事件處理器每隔15分鐘向Oracle數據庫寫入明細數據
  5. Oracle OBI根據數據庫生成歷史報表

具體的事件處理器,處理引擎,還有Oracle的各類工具,就不得其解了,太商業了。

相關文章
相關標籤/搜索