多維分析的本質計算是什麼?能作什麼又不能作什麼?

多維分析主要面向業務用戶提供數據查詢分析服務,因爲業務人員不懂 SQL,也沒法完成多表關聯(有意義的查詢常常是基於多表的),因此在多維分析建模階段須要將多表轉換成單表,也就是 CUBE。這樣用戶就能夠很方便地經過基於一個結果集(CUBE)進行拖拽查詢,從不一樣的角度(維度)觀察數據(測度)。html

在多維分析中主要的計算就是按照某一個或一些維度彙總測度,如按地區彙總銷售額,按年和產品彙總銷量等。從運算角度來看,多維分析的本質計算就是:函數

基於一個表的分組彙總url

若是用 SQL 來表達,多維分析的本質就是:.net

SELECT D,…, SUM(M), … FROM C WHERE D’=d’ AND … GROUP BY D,…指針

即對數據立方體按某些維度分組彙總某些測度。其中 C 是數據立方體,D,…是選出維度,M,…是聚合測度,聚合函數也能夠不是 SUM。D’是切片維度,切塊時條件爲 D IN (d,…),WHERE 中還能夠增長針對某些測度的條件,通常也就是選出某個區間內的值。htm

針對一個結果集(CUBE),多維分析能夠進行切片 / 切塊、旋轉、鑽取 / 上卷等操做。blog

1. 切片
切片是指針對 CUBE,選擇維中固定值進行分析,好比固定時間維度分析地區和產品的銷量狀況。
imagepngget

2. 旋轉
旋轉也稱行列變換,是指維度從行到列或者從列到行,旋轉是爲了知足用戶觀察數據的不一樣習慣。
imagepng產品

3. 鑽取
鑽取是從粗粒度到細粒度觀察數據的過程,好比咱們發現某個彙總值出現異常,就能夠經過鑽取查看明細數據,找到異常緣由。鑽取能夠從彙總到明細,從上級到下級…
imagepngio

從多維分析的本質及其操做來看,多維分析只能完成簡單的分組彙總、過濾計算,這在實際業務中還遠遠不夠。常見的固定報表業務,一些報表很難經過簡單的分組聚合來實現,常常要編寫上千行的 SQL 或存儲過程,並且固定報表的表格樣式可能很複雜,這些都是多維分析沒法實現的。

這種報表數據處理邏輯複雜,每一個格子可能對應不一樣的數據來源,計算邏輯也不同,在樣式方面則會出現表頭混亂,大格套小格,動態區域和靜態區域混合的狀況。
imagepng

這裏列舉了複雜報表的特色: 傳說中的中國複雜報表都長什麼樣?有什麼特色? 這些類型的報表都沒法經過多維分析拖拽出來。

事實上,固定報表和自助報表(多維分析)面向的需求場景很不同,而在 BI 系統中每每會包含三部份內容,固定報表、多維分析和可視化,其中可視化能夠由前兩部分實現,但固定報表和多維分析每每是不可或缺的,兩者相互配合,優點互補。認清了多維分析的能量圈,才能在 BI 系統建設中有的放矢,避免踩坑。

對多維分析和 BI 技術感興趣的同窗還能夠搜索「乾學院」,上面有整套的免費「商業智能」技術課程, 或者直接訪問下面連接:
http://www.raqsoft.com.cn/wx/course-Business-Intelligence.html

相關文章
相關標籤/搜索