OLAP

1、定義數據庫

        聯機分析處理(OLAP)系統是一套以多維度方式分析數據,而能彈性地提供積存(英語:Roll-up)、下鑽(英語:Drill-down)、和透視分析(英語:pivot)等操做,呈現集成性決策信息的方法,多用於決策支持系統、商務智能或數據倉庫。。它是數據倉庫系統最主要的應用,專門設計用於支持複雜的分析操做,側重對決策人員和高層管理人員的決策支持,能夠根據分析人員的要求快速、靈活地進行大數據量的複雜查詢處理,而且以一種直觀而易懂的形式將查詢結果提供給決策人員,以便他們準確掌握企業(公司)的經營情況,瞭解對象的需求,制定正確的方案。數組

2、分類服務器

        OLAP系統按照其存儲器的數據存儲格式能夠分爲關係OLAP(RelationalOLAP,簡稱ROLAP)、多維OLAP(MultidimensionalOLAP,簡稱MOLAP)和混合型OLAP(HybridOLAP,簡稱HOLAP)三種類型。工具

a.ROLAP
  ROLAP將分析用的多維數據存儲在關係數據庫中並根據應用的須要有選擇的定義一批實視圖做爲表也存儲在關係數據庫中。沒必要要將每個SQL查詢都做爲實視圖保存,只定義那些應用頻率比較高、計算工做量比較大的查詢做爲實視圖。對每一個針對OLAP服務器的查詢,優先利用已經計算好的實視圖來生成查詢結果以提升查詢效率。同時用做ROLAP存儲器的RDBMS也針對OLAP做相應的優化,好比並行存儲、並行查詢、並行數據管理、基於成本的查詢優化、位圖索引、SQL的OLAP擴展(cube,rollup)等等。
b.MOLAP
  MOLAP將OLAP分析所用到的多維數據物理上存儲爲多維數組的形式,造成「立方體」的結構。維的屬性值被映射成多維數組的下標值或下標的範圍,而總結數據做爲多維數組的值存儲在數組的單元中。因爲MOLAP採用了新的存儲結構,從物理層實現起,所以又稱爲物理OLAP(PhysicalOLAP);而ROLAP主要經過一些軟件工具或中間軟件實現,物理層仍採用關係數據庫的存儲結構,所以稱爲虛擬OLAP(VirtualOLAP)。
c.HOLAP
  因爲MOLAP和ROLAP有着各自的優勢和缺點(以下表所示),且它們的結構迥然不一樣,這給分析人員設計OLAP結構提出了難題。爲此一個新的OLAP結構——混合型OLAP(HOLAP)被提出,它能把MOLAP和ROLAP兩種結構的優勢結合起來。迄今爲止,對HOLAP尚未一個正式的定義。但很明顯,HOLAP結構不該該是MOLAP與ROLAP結構的簡單組合,而是這兩種結構技術優勢的有機結合,能知足用戶各類複雜的分析請求。大數據

3、邏輯概念優化

OLAP展示在用戶面前的是一幅幅多維視圖。設計

維(Dimension):是人們觀察數據的特定角度,是考慮問題時的一類屬性,屬性集合構成一個維(時間維、地理維等)。對象

維的層次(Level):人們觀察數據的某個特定角度(即某個維)還能夠存在細節程度不一樣的各個描述方面(時間維:日期、月份、季度、年)。索引

維的成員(Member):維的一個取值,是數據項在某維中位置的描述。(「某年某月某日」是在時間維上位置的描述)。數據分析

度量(Measure):多維數組的取值。(2000年1月,上海,筆記本電腦,0000)。

OLAP的多維分析操做包括:鑽取(Drill-down)、上卷(Roll-up)、切片(Slice)、切塊(Dice)以及旋轉(Pivot),下面仍是以上面的數據立方體爲例來逐一解釋下:

鑽取(Drill-down):在維的不一樣層次間的變化,從上層降到下一層,或者說是將彙總數據拆分到更細節的數據,好比經過對2010年第二季度的總銷售數據進行鑽取來查看2010年第二季度四、五、6每月的消費數據,如上圖;固然也能夠鑽取浙江省來查看杭州市、寧波市、溫州市……這些城市的銷售數據。

上卷(Roll-up):鑽取的逆操做,即從細粒度數據向高層的聚合,如將江蘇省、上海市和浙江省的銷售數據進行彙總來查看江浙滬地區的銷售數據,如上圖。

切片(Slice):選擇維中特定的值進行分析,好比只選擇電子產品的銷售數據,或者2010年第二季度的數據。

切塊(Dice):選擇維中特定區間的數據或者某批特定值進行分析,好比選擇2010年第一季度到2010年第二季度的銷售數據,或者是電子產品和日用品的銷售數據。

旋轉(Pivot):即維的位置的互換,就像是二維表的行列轉換,如圖中經過旋轉實現產品維和地域維的互換。

4、OLAP的優點

        首先必須說的是,OLAP的優點是基於數據倉庫面向主題、集成的、保留歷史及不可變動的數據存儲,以及多維模型多視角多層次的數據組織形式,若是脫離的這兩點,OLAP將不復存在,也就沒有優點可言。

數據展示方式
  基於多維模型的數據組織讓數據的展現更加直觀,它就像是咱們日常看待各類事物的方式,能夠從多個角度多個層面去發現事物的不一樣特性,而OLAP正是將這種尋常的思惟模型應用到了數據分析上。

查詢效率
  多維模型的創建是基於對OLAP操做的優化基礎上的,好比基於各個維的索引、對於一些經常使用查詢所建的視圖等,這些優化使得對百萬千萬甚至上億數量級的運算變得駕輕就熟。

分析的靈活性   咱們知道多維數據模型能夠從不一樣的角度和層面來觀察數據,同時能夠用上面介紹的各種OLAP操做對數據進行聚合、細分和選取,這樣提升了分析的靈活性,能夠從不一樣角度不一樣層面對數據進行細分和彙總,知足不一樣分析的需求。

相關文章
相關標籤/搜索