簡單設計一個onedata指標管理體系

時間 2021-07-24

標籤架構阿里雲 blog 支付寶 table 支付數據 img tab 欄目系統架構简体版

原文原文鏈接

以阿里雲的maxcompute的數據倉庫架構爲例，架構

從上往下定義，阿里雲

dwp的數據，來源是dws+dim，最主要是dws。這裏不討論dim的做用。blog

dws的數據來源於dwd。支付寶

dwd的數據來源於ods。table

--------im

接下來咱們定義原子指標和派生指標。支付

派生指標定義在dws層。而且綁定原子指標。全部的應用數據由派生指標去group by。數據

原子指標定義在dwd層+虛擬層。原子指標綁定一個dwd的度量值，可是有可能會有計算，因此不徹底在dwd，運行的時候可能會進行計算。稱爲一個虛擬的層。img

固然能夠把這個虛擬層作出來，專門作一層原子指標層。tab

這個時候咱們的指標管理系統裏面應該有如下東西：

	指標名稱	指標來源	指標口徑
原子指標	能夠與度量值一致，也能夠不一致	綁定dwd的表名和字段	1.和綁定的dwd的度量值徹底對應 2.須要一點計算，錄入計算邏輯
派生指標	修飾詞+原子指標名稱+時間週期	綁定一個原子指標	①修飾詞：做爲where過濾的字段 ②時間週期：近7天，近一個月等 ③聚合操做：平均，求和等 ③聚合維度，也能夠不錄，在模型管理裏錄
應用指標	同環比+修飾詞+派生指標	綁定一個派生指標	①聚合的維度：派生指標所在表的字段 ②可能有一些簡單的過濾。 ③可能會有一些同環比的計算絕對不容許有字段計算，如加減乘除，if轉化等，若是有，說明邏輯沒有下沉。

舉個例子：

應用指標須要：當月人流量大於2w次而且支付渠道爲支付寶的的平均訂單金額淨增加，維度：每個城市

擁有的業務過程：訂單表。門店人流量表。

	名稱	來源	口徑
原子指標	訂單金額	交易表：支付金額，退款金額	支付金額-退款金額
派生指標	當月人流量大於2w次而且支付渠道爲支付寶的的平均訂單金額	訂單金額	①修飾詞： where 支付渠道=支付寶 having 月人流量>2w ②時間週期 where 訂單時間是一個月 ③聚合操做：平均 ③維度：城市，品類 (聚合維度比業務指標更寬）
應用指標	當月人流量大於2w次而且支付渠道爲支付寶的的平均訂單金額淨增加	當月人流量大於2w次而且支付渠道爲支付寶的的平均訂單金額	①聚合維度：城市 ②環比計算，當月減上月