滴滴數據倉庫指標體系建設實踐

桔妹導讀:指標體系是什麼?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規範化、工具化管理指標體系?本文會對建設的方法論結合滴滴數據指標體系建設實踐進行解答分析。html



1. 
什麼是指標體系

1.1 指標體系定義算法


指標體系是將零散單點的具備相互聯繫的指標,系統化的組織起來,經過單點看全局,經過全局解決單點的問題。它主要由指標和體系兩部分組成。小程序


指標是指將業務單元細分後量化的度量值,它使得業務目標可描述、可度量、可拆解,它是業務和數據的結合,是統計的基礎,也是量化效果的重要依據。安全


指標主要分爲結果型和過程型:微信


  • 結果型指標
    用於衡量用戶發生某個動做後所產生的結果,一般是延後知道的,很難進行干預。結果型指標更多的是監控數據異常,或者是監控某個場景下用戶需求是否被知足
    架構

  • 過程型指標
    用戶在作某個動做時候所產生的指標,能夠經過某些運營策略來影響這個過程指標,從而影響最終的結果,過程型指標更加關注用戶的需求爲何被知足或沒被知足
    app

 

體系是由不一樣的維度組成,而維度是指用戶觀察、思考與表述某事物的「思惟角度」,維度是指標體系的核心,沒有維度,單純說指標是沒有任何意義的。運維


維度主要分爲定性維度和定量維度,定性維度,主要是偏文字描述類如城市、性別、職業等;定量維度,主要是數值類描述如收入、年齡等,對定量維度須要作數值分組處理。分佈式

 


1.2 指標體系生命週期工具

 

生命週期主要包含定義、生產、消費、下線四個階段。針對整個生命週期要持續作指標運維、質量保障,同時爲了提升指標數據複用度,下降用戶使用成本須要作對應的數據運營工做。




1.3 綜合使用場景


指標體系主要是結合用戶的業務場景來進行使用,多個不一樣的指標和維度能夠組合起來進行業務的綜合分析,用戶可經過指標的變化看到總體業務的變化,並可以快速發現問題、定位問題。經常使用的場景一種是決策分析的場景,經過數據看清業務現狀進行戰略決策支持,另外一種是運營分析場景,不管是作用戶運營、產品運營仍是活動運營都須要各種指標數據的支撐去看清問題、分析問題和指導解決問題。




2. 

爲何搭建指標體系


  • 衡量業務發展質量    

    指標體系能夠反映業務客觀事實,看清業務發展示狀,經過指標對業務質量進行衡量,把控業務發展狀況,針對發現的業務問題聚焦解決,促進業務有序增加
  • 創建指標因果關係  

    主要明確結果型指標和過程型指標關係,經過結果指標回溯過程指標,找到解決問題的核心緣由

  • 指導用戶分析工做  
    目的創建產品評估體系、活動效果評估體系、智能運營分析體系
  • 指導基礎數據建設  
    明確基礎數據建設方向,集中資源,避免過程和結果分析指標數據的遺漏或缺失
  • 指導內容產品建設   
    結合用戶的業務場景來進行使用,多個不一樣的指標和維度能夠組合起來進行業務的綜合分析,用戶可經過指標的變化看到總體業務的變化,並可以快速發現問題、定位問題
  • 統一指標消費口徑  
    企業內統一關鍵指標業務口徑及計算口徑,統一企業業務目標,實現自上而下目標驅動




3. 

如何搭建指標體系

指標體系建設的經常使用方法是經過場景化進行指標體系的搭建,以用戶的視角場景化思考,自上而下業務驅動指標體系建設,因此要在特定場景下作好指標體系建設,須要先選好指標,而後用科學的方法搭建指標體系。



3.1 科學方法選指標


選指標經常使用方法是指標分級方法OSM模型


指標分級主要是指標內容縱向的思考,根據企業戰略目標、組織及業務過程進行自上而下的指標分級,對指標進行層層剖析,主要分爲三級T一、T二、T3。


  • T1指標:公司戰略層面指標

    用於衡量公司總體目標達成狀況的指標,主要是決策類指標,T1指標使用一般服務於公司戰略決策層
  • T2指標:業務策略層面指標

    爲達成T1指標的目標,公司會對目標拆解到業務線或事業羣,並有針對性作出一系列運營策略,T2指標一般反映的是策略結果屬於支持性指標同時也是業務線或事業羣的核心指標。T2指標是T1指標的縱向的路徑拆解,便於T1指標的問題定位,T2指標使用一般服務業務線或事業羣
  • T3指標:業務執行層面指標

    T3指標是對T2指標的拆解,用於定位T2指標的問題。T3指標一般也是業務過程當中最多的指標。根據各職能部門目標的不一樣,其關注的指標也各有差別。T3指標的使用一般能夠指導一線運營或分析人員開展工做,內容偏過程性指標,能夠快速引導一線人員作出相應的動做。

 

例如:成交率的指標分級



OSM模型(Obejective,Strategy,Measurement)是指標體系建設過程當中輔助肯定核心的重要方法,包含業務目標、業務策略、業務度量,是指標內容橫向的思考。


  • O

    用戶使用產品的目標是什麼?產品知足了用戶的什麼需求? 主要從用戶視角和業務視角肯定目標,原則是切實可行、易理解、可干預、正向有益
  • S

    爲了達成上述目標我採起的策略是什麼?
  • M

    這些策略隨之帶來的數據指標變化有哪些?

 

以滴滴網約車爲例,按照OSM模型,它的指標是什麼樣的?


  • O:用戶來使用滴滴這個產品,需求和目標是什麼?

    • 用戶需求及目標是便捷、快速打到車,安全到達目的地

 

那如何讓用戶感覺到本身的需求被知足了呢?


  • S:滴滴作的策略是:
    • 便捷方面,提供了獨立APP版本、小程序版本,還能夠多渠道打到車,例如在高德、微信、支付寶都有打車入口;起始、目的地地圖智能精準定位;最優路線選擇等
    • 快速方面,針對不一樣人羣不一樣訴求提供了多品類產品選擇,例如快車、優享、拼車、出租車等業務,根據遲早高峯提升熱點區域運力,減小用戶排隊時間
    • 安全方面,司機准入機制,司機合規機制,司機畫像
  • M:咱們須要針對這些策略去作指標,在這裏面咱們的指標分別是結果指標和過程指標:
    • 結果指標:渠道轉化完成率、乘客取消率、供需比、司機服務分
    • 過程指標:渠道發單數、渠道完單數、排隊乘客數、乘客排隊時長、司機好評率、司機接單量、司機取消數等

 

指標選取以後,下面就是最重要的分析維度選擇了,前面指標體系定義裏講過維度是指標體系的核心,沒有維度,單純說指標是沒有任何意義的。因此維度選擇層面主要經過數據分析視角結合實際分析業務場景來肯定。例如城市維度、商圈維度、渠道維度、時間維度、用戶標籤維度等。



3.2 用分析模型搭建指標體系

在《精益數據分析》一書中給出了兩套比較經常使用的指標體系建設方法論,其中一個就是比較有名的海盜指標法,也就是咱們常常聽到的AARRR海盜模型。海盜模型是用戶分析的經典模型,它反映了增加是系統性地貫穿於用戶生命週期各個階段的:用戶拉新(Acquisition)、用戶激活(Activation)、用戶留存(Retention)、商業變現(Revenue)、用戶推薦(Referral)。

 

AARRR模型


  • A拉新
    經過各類推廣渠道,以各類方式獲取目標用戶,並對各類營銷渠道的效果評估,不斷優化投入策略,下降獲客成本。涉及關鍵指標例如新增註冊用戶數、激活率、註冊轉化率、新客留存率、下載量、安裝量等
  • A活躍
    活躍用戶指真正開始使用了產品提供的價值,咱們須要掌握用戶的行爲數據,監控產品健康程度。這個模塊主要反映用戶進入產品的行爲表現,是產品體驗的核心所在。涉及關鍵指標例如DAU/MAU 、日均使用時長、啓動APP時長、啓動APP次數等
  • R留存
    衡量用戶粘性和質量的指標。涉及關鍵指標例如留存率、流失率等
  • R變現
    主要用來衡量產品商業價值。涉及關鍵指標例如生命週期價值(LTV)、客單價、GMV等

  • R推薦
    衡量用戶自傳播程度和口碑狀況。涉及關鍵指標例如邀請率、裂變係數等

     

能夠根據實際業務場景,結合使用OSM和AARRR模型,來系統性的選擇不一樣階段所須要的核心數據指標。




3.3 場景化搭建指標體系

目前階段互聯網業務比較流行的一種通用抽象場景「人、貨、場」,實際就是咱們平常所說的用戶、產品、場景,在通俗點講就是誰在什麼場景下使用了什麼產品,不一樣的商業模式會有不一樣的組合模式。
 
以滴滴實際場景爲例:哪些場景(此處場景定義爲終端,如Native,微信,支付寶)的什麼人(乘客)在平臺上使用了哪些貨(平臺業務線,如快車/專車等),進而爲評估用戶增加的價值和效果。

3.3.1 「人」的視角

從「人」的視角,咱們比較關心的是什麼乘客在什麼時間打的車,排了多長時間,等了多長時間上車,週期內第幾回打車,打車花了多少錢,是否有投訴和取消行爲,具體到數據指標主要看發單用戶數、完單用戶數、客單價、週期內完單訂單數、取消訂單數、評價訂單數等。


3.3.2 「貨的視角


從「貨」的視角,咱們比較關心的就是成交了多少,交易額多少,花了多少,到具體數據指標主要會看GMV、成交率、取消率指標,在進一步會細分到城市、區域,一級品類、二級品類。數據的效果經過目標對比,橫向對比、歷史比較等方式進行分析肯定。



3.3.3 「場」的視角


從「場」的視角,咱們比較關心的就是哪一個渠道用戶點擊量大曝光率大,帶來了多少新用戶,完成多少交易訂單,客單價是多少;或者是哪一個活動拉新或促活效果怎麼樣轉化率多少,結合場景數據實際狀況制定對應策略。



以上分別從「人」、「貨」、「場」三個角度進行了數據指標和分析維度的提煉,下面咱們把三類指標結合指標分級方法進行分解關聯。





4. 

怎麼管理指標體系

4.1 痛點分析

 
主要從業務、技術、產品三個視角來看:

  • 業務視角

    業務分析場景指標、維度不明確;

    頻繁的需求變動和反覆迭代,數據報表臃腫,數據良莠不齊;

    用戶分析具體業務問題找數據、覈對確認數據成本較高。

  • 技術視角

    指標定義,指標命名混亂,指標不惟一,指標維護口徑不一致;

    指標生產,重複建設;數據彙算成本較高;

    指標消費,數據出口不統一,重複輸出,輸出口徑不一致;

  • 產品視角

    缺少系統產品化支持從生產到消費數據流沒有系統產品層面打通;



4.2 管理目標

 
  • 技術目標   

    統一指標和維度管理,指標命名、計算口徑、統計來源惟一,  維度定義規範、維度值一致

  • 業務目標   
    統一數據出口、場景化覆蓋

  • 產品目標   
    指標體系管理工具產品化落地;指標體系內容產品化落地支持決策、分析、運營例如決策北極星、智能運營分析產品等



4.三、模型架構



4.3.1 業務線

業務板塊定義原則:業務邏輯層面進行抽象、物理組織架構層面進行細分,可根據實際業務狀況進行層級分拆細化,層級分級建議進行最多進行三級分拆,一級細分可公司層面統一規範肯定,二級及後續拆分可根據業務線實際業務進行拆分。例如滴滴出行領域業務邏輯層面兩輪車和四輪車都屬於出行領域可抽象出行業務板塊(level一級),根據物理組織架構層面在進行細分普惠、網約車、出租車、順風車(level二級),後續根據實際業務需求可在細分,網約車可細分獨乘、合乘,普惠可細分單車、企業級。

4.3.2 規範定義

  1. 數據域
    指面向業務分析,將業務過程或者維度進行抽象的集合。其中,業務過程能夠歸納爲一個個不拆分的行爲事件,在業務過程之下,能夠定義指標;維度,是度量的環境,如乘客呼單事件,呼單類型是維度。爲了保障整個體系的生命力,數據域是須要抽象提煉,而且長期維護更新的,變更需執行變動流程。

  2. 業務過程

    指公司的業務活動事件,如,呼單、支付都是業務過程。其中,業務過程不可拆分。

  3. 時間週期

    用來明確統計的時間範圍或者時間點,如最近30天、天然周、截止當日等。

  4. 修飾類型

    是對修飾詞的一種抽象劃分。修飾類型從屬於某個業務域,如日誌域的訪問終端類型涵蓋APP端、PC端等修飾詞。

  5. 修飾詞
    指的是統計維度之外指標的業務場景限定抽象,修飾詞屬於一種修飾類型,如在日誌域的訪問終端類型下,有修飾詞APP、PC端等。
  6. 度量/原子指標

    原子指標和度量含義相同,基於某一業務事件行爲下的度量,是業務定義中不可再拆分的指標,具備明確業務含義的名稱,如支付金額。

  7. 維度

    維度是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,也能夠稱爲實體對象。維度屬於一個數據域,如地理維度(其中包括國家、地區、省市等)、時間維度(其中包括年、季、月、周、日等級別內容)。

  8. 維度屬性

    維度屬性隸屬於一個維度,如地理維度裏面的國家名稱、國家ID、省份名稱等都屬於維度屬性。

  9. 指標分類
    主要分爲原子指標、派生指標、衍生指標


  1. 原子指標    
    基於某一業務事件行爲下的度量,是業務定義中不可再拆分的指標,具備明確業務含義的名稱,如呼單量、交易金額

  2. 派生指標    
    是1個原子指標+多個修飾詞(可選)+時間週期,是原子指標業務統計範圍的圈定。
    派生指標又分如下二種類型:

    1. 事務型指標:
      是指對業務過程進行衡量的指標。例如,呼單量、訂單支付金額,這類指標須要維護原子指標以及修飾詞,在此基礎上建立派生指標。
    2. 存量型指標:

      是指對實體對象(如司機、乘客)某些狀態的統計,例如註冊司機總數、註冊乘客總數,這類指標須要維護原子指標以及修飾詞,在此基礎上建立派生指標,對應的時間週期通常爲「歷史截止當前某個時間」。
  3. 衍生指標
    是在事務性指標和存量型指標的基礎上覆合成的。主要有比率型、比例型、統計型均值 


4.3.3 模型設計

主要採用維度建模方法進行構建,基礎業務明細事實表主要存儲維度屬性集合和度量/原子指標;分析業務彙總事實表按照指標類別(去重指標、非去重指標)分類存儲,非去重指標彙總事實表存儲統計維度集合、原子指標或派生指標,去重指標彙總事實表只存儲分析實體統計標籤集合。

指標體系在數倉物理實現層面主要是結合數倉模型分層架構進行指導建設,滴滴的指標數據主要存儲在DWM層,做爲指標的核心管理層。



4.4 指標體系元數據管理

4.4.1 維度管理
 
包括基礎信息和技術信息,由不一樣角色進行維護管理。

  • 基礎信息對應維度的業務信息,由業務管理人員、數據產品或BI分析師維護,主要包括維度名稱、業務定義、業務分類。
  • 技術信息對應維度的數據信息,由數據研發維護,主要包括是否有維表(是枚舉維度仍是有獨立的物理維表)、是不是日期維、對應code英文名稱和中文名稱、對應name英文名稱和中文名稱。若是維度有維度物理表,則須要和對應的維度物理表綁定,設置code和name對應的字段。若是維度是枚舉維,則須要填寫對應的code和name。維度的統一管理,有利於之後數據表的標準化,也便於用戶的查詢使用。


4.4.2 指標管理

包括基礎信息、技術信息和衍生信息,由不一樣角色進行維護管理。 

  • 基礎信息對應指標的業務信息,由業務管理人員、數據產品或BI分析師維護,主要包括歸屬信息(業務板塊、數據域、業務過程),基本信息(指標名稱、指標英文名稱、指標定義、統計算法說明、指標類型(去重、非去重)),業務場景信息(分析維度,場景描述);
  • 技術信息對應指標的物理模型信息,由數據研發進行維護,主要包括對應物理表及字段信息;
  • 衍生信息對應關聯派生或衍生指標信息、關聯數據應用和業務場景信息,便於用戶查詢指標被哪些其它指標和數據應用使用,提供指標血緣分析追查數據來源的能力。


原子指標定義歸屬信息 + 基本信息 + 業務場景信息
派生指標定義時間週期 + 修飾詞集合 + 原子指標
修飾類型主要包含類型說明、統計算法說明、數據源(可選)
 

4.5 指標體系建設流程
 
4.5.1 建模流程
 
建模流程主要是從業務視角指導工程師對需求場景涉及的指標進行主題抽象,歸類,統一業務術語,減小溝通成本,同時避免後續的指標重複建設。


分析數據體系是模型架構中彙總事實表的物理集合,業務邏輯層面根據業務分析對象或場景進行指標體系抽象沉澱。滴滴出行主要是根據分析對象進行主題抽象的,例如司機主題、安全主題、體驗主題、城市主題等。指標分類主要是根據實際業務過程進行抽象分類,例如司機交易類指標、司機註冊類指標、司機增加類指標等。
 
基礎數據體系是模型架構中明細事實表和基礎維度表的物理集合,業務邏輯層面根據實際業務場景進行抽象例如司機合規、乘客註冊等,還原業務核心業務過程。
 
4.5.2 開發流程
 
開發流程是從技術視角指導工程師進行指標體系生產、運維及質量管控,也是數據產品或數據分析師和數倉研發溝通協調的橋樑。



4.6 指標體系圖譜建設

4.6.1 指標體系圖譜概述

指標體系圖譜也可稱爲數據分析圖譜主要是依據實際業務場景抽象業務分析實體,整合梳理實體涉及的業務分類、分析指標和維度的集合。
 
建設方法:
主要是經過業務思惟、用戶視角去構建,把業務和數據緊密關聯起來,把指標結構化分類組織
 

建設目的:

  • 對於用戶:

    便於用戶可以快速定位所需指標和維度,同時經過業務場景化沉澱指標體系,可以快速觸達用戶數據訴求
  • 對於研發:

    利於後續指標生產模型設計、數據內容邊界化、數據體系建設迭代量化和數據資產的落地

   
4.6.2 指標體系圖譜模型


4.6.3 指標體系圖譜實例





5. 

指標體系產品化


指標體系涉及的產品集主要是依據其生命週期進行相應建設,經過產品工具打通數據流,實現指標體系統一化、自動化、規範化、流程化管理。由於指標體系建設本質目標是服務業務,實現數據驅動業務價值,因此建設的核心原則是 「輕標準、重場景,從管控式到服務式」。經過工具、產品、技術和組織的融合提升用戶使用數據效率,加速業務創新迭代。

其中和指標體系方法論強相關產品就是指標字典工具的落地,其產品的定位及價值:

  • 支撐指標管理規範從方法到落地的工具,自動生成規範指標,解決指標名稱混亂、指標不惟一的問題,消除數據的二義性
  • 統一對外提供標準的指標口徑和元數據信息

 

工具設計流程 (方法論->定義->生產->消費)


指標定義


指標生產



6. 

結束語

文章總體介紹了滴滴指標體系建設方法論和工具產品的建設狀況,目前指標字典和開發工具已實現流程打通,與數據消費產品的打通後續會經過DataAPI方式提供數據服務,規劃建設中。指標體系建設方法論和工具已經在滴滴集團內進行推廣使用,滴滴網約車、普惠、車服等部門已經開始接入使用,截止目前共有5000+指標進入指標體系,覆蓋公司核心業務板塊、88個數據域、385個業務過程,52個業務場景,方法論和工具也會持續迭代實踐。




團隊介紹

滴滴雲平臺事業羣滴滴基礎平臺部數據治理部-數倉團隊負責公司網約車、出租車、順風車、國際化出行業務的數據倉庫的架構、規劃、設計及數據內容產品的建設工做。支撐公司運營、產品、分析、戰略、安全、體驗等核心業務部門的數據決策分析,提供完整、可靠、高質量的數據服務。


做者介紹

專一數據倉庫體系化建設,產品化數倉理念推廣及實踐者



延伸閱讀

             

內容編輯 | Charlotte
聯繫咱們 | DiDiTech@didiglobal.com

本文分享自微信公衆號 - 滴滴技術(didi_tech)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索