ODS(英語:Operational Data Store)是一種數據架構或數據庫設計的概念,出現緣由是來自於當須要集成來自多個系統的數據,結果又要給一或多個系統使用時。sql
1、概念數據庫
ODS (Operational Data Store)操做型數據存儲,ODS具有數據倉庫的部分特徵和OLTP系統的部分特徵,它是「集成的、當前或接近當前的、不斷變化的」數據,通常不保留數據的變更軌跡,是數據倉庫體系結構中的一個可選部分。架構
ODS的數據具備面向主題、集成的、可變的和數據是當前的或是接近當前的4個基本特徵。一樣也能夠看出ODS是介於DB和DW 之間的一種數據存儲技術,和原來面向應用的分散的DB相比,ODS中的數據組織方式和數據倉庫(DW)同樣也是面向主題的和集成的,因此對進入ODS的數據也象進入數據倉庫的數據同樣進行集成處理。另外ODS只是存放當前或接近當前的數據,若是須要的話還能夠對ODS中的數據進行增、刪和更新等操做,雖然DW中的數據也是面向主題和集成的,但這些數據通常不進行修改,因此ODS和DW的區別主要體現數據的可變性、當前性、穩定性、彙總度上。oracle
2、ODS與DW比較數據庫設計
ODS | DW |
主要是和源系統表結構相同,表結構隨着源系統變化 | 面向主題的表模型,模型相對穩定 |
通常只保留最新數據或較短期段的數據 | 歷史數據,記錄軌跡 |
追求時間窗口短,知足報表數據的實效性 | 批處理時間窗口較長 |
Update、Insert、Merge操做 | 主要是Insert操做 |
3、ODS與DW應用實施工具
實施方案 | 特色 | 風險 |
數據倉庫(DW) | 通常包含一個數據準備層,先進行源數據採集和清洗;有穩定成熟的模型; | 投入大、風險高 |
操做型數據存儲(ODS) | 主要是快速採集源數據;通常也會採用DW的一些技術;能夠部分保留較少天數的歷史數據,不能知足企業的中遠期決策需求;缺點是數沒有穩定的數據層; | 投資小、但涉及技術較多 |
ODS+DW | 通常ODS用於報表數據源,同時爲DW提供數據;DW做決策支持,提供歷史數據; | 通常須要分步實施,下降風險 |
實施方案sqlserver |
實施結果 | 優點 | 劣勢 |
ODS | 企業可以把握ODS中的當前綜合數據對企業當前的運營狀況隨時掌控 | 能夠知足企業的實時監控和實時業務需求 | 不能解決企業的中遠決策需求 |
DW | 企業可以分析DW中的歷史數據,進行中遠期的規劃 | 能夠解決企業的中遠決策需求 | 不能知足企業的實時監控和實時業務需求 |
4、經常使用術語spa
ETL(Extract Transform Load) | 例如IBM Datastage、Informatic PowerCenter |
DM(Data Mart)數據集市 | 數據集市也可叫作「小數據倉庫」。若是說數據倉庫是創建在企業級的數據模型之上的話。那麼數據集市就是企業級數據倉庫的一個子集,他主要面向部門級業務,而且只面向某個特定的主題。數據集市能夠在必定程度上解決訪問數據倉庫的瓶頸 |
Cognos | 報表開發展示工具 |
Cube | 數據立方體,Cognos基於文件的多維數據組織,用於多維分析 |
主數據 | 主要的業務數據,例如客戶信息、卡、賬戶 |
Metadata元數據 | 數據的數據,包括數據源元數據、ETL規則元數據、OD元數據、報表元數據、接口文件元數據、業務規則元數據等 |
5、ODS優缺點設計
主要優勢:orm
一、提供T+1同構表給MIS系統使用,減輕了對源交易系統的數據訪問壓力;
二、屏蔽了衆多的、異構的數據庫,例如DB2/400、sqlserver,物理上集中存放到oracle數據庫,下降了MIS系統部署難度;
三、能夠統一進行清洗和簡單的處理,例如統一Trim;
四、提供部分整合後的主數據層供用戶訪問,能夠下降源系統變化帶來的影響;
五、對多個應用系統公用的數據指標能夠統一加工,提供公共加工層表;
六、提供各源系統批處理結束標誌,方便MIS日報開發;
七、對MIS系統的批處理做業能夠提供統一調度;
八、提供部分錶的歷史數據保存,方便MIS使用;
缺點和不足:
一、改善源系統的數據質量的能力有限,例如:若是源系統沒有最後修改日期字段,ODS也較難提供增量數據給後面的應用系統; 二、增大了數據錯誤的機率;若是經過ETL工具也能夠直接訪問多個源系統數據並完成數據加工,在數據準確性上保障更高; 三、由於不能掌握所有的源系統數據,例如繁多的登記薄,一段時間內還須要由需求推進同構表的分析和採集工做; 四、沒有穩定的、面向主題的數據模型; 五、不能大量地保存歷史數據; 六、批處理時間窗口內不能提供數據訪問;