滴滴宋世君:DS(數據分析師),到底是作什麼的?

出品 | 滴滴技術
做者 | 宋世君算法

圖片描述

前言:本文的做者是滴滴出行數據科學部負責人宋世君,曾在 Facebook 、Google 核心部門就任,是知名的華人數據分析總監。經世君老師受權在此分享給你們,但願讓你們理解數據分析師的背後——數據對於一個產品的核心價值,不管把握數據的是DS,仍是研發、產品同窗。但願可以幫到你。網絡

DS 在市場上是近些年出現的一個新的職能,比起研發、算法、產品、運營等等這些已經演進二三十年的職能,咱們仍是在很是年輕的階段。工具

一方面,從市場上人才的供需關係能夠看出來這個職能的發展和需求,可是另外一方面,和任何新事物同樣,這個新的職能也有不少挑戰,今天我想談談我怎麼看待 DS 這個職能,和咱們的發展方向。學習

首先,咱們要明確 DS 並非一個公司的」必要」職能,可是在一個公司的發展壯大過程當中又會有 DS 出現的必然性和存在的合理性。咱們就像一把槍上的準星,沒有準星也能開槍,可是準星能使這把槍更加有用。公司沒有任何人作數據分析,短時間也依然能運行,只是不少地方運行地會不太好;若是有一天公司裏作數據分析的人都消失了,公司短期內也不會垮掉,可是時間長一些確定會有影響。spa

當咱們不是」必要」職能的時候,咱們就要問本身「DS 是誰」、「DS 作什麼」、「DS 存在的價值是什麼」、 「DS 要往哪一個方向發展」?對象

▎DS 是誰圖片

用心理學的術語,這個實際上是 DS 的「本我」。咱們是一羣在相關量化領域受過專業的訓練,而且但願應用本身的量化能力,在數據中挖掘對業務有用的信息,而且經過這些信息爲業務發展提供助力可是同時又保持數據的中立性的人。數據分析

一個職能(或者說公司裏的一個崗位)是由他應該作什麼決定的,而不是由他正在作什麼決定的。因此,咱們描述 DS ,更多的是從咱們本身以爲咱們應該作什麼,而不是咱們現狀作什麼。好比不少同窗有這樣的疑問」 DS 作大量取數的事情」,甚至不少業務合做方」期待咱們知足不少取數的需求」。這些都與 DS 是誰無關,這隻能說明咱們尚未作好咱們的工做,還有不少地方須要努力 ( 後面會展開談 )。產品

從個體的角度,這也意味着咱們看待 DS 並非看這我的的學術專業,而是看這我的的動機和意願。公司裏跟數據有關的職能是多樣的,有些是把數據做爲拿到業務結果的抓手。要對業務結果負責,這些是數據運營。有些是把數據做爲研發的對象,對跟數據相關的這些產品負責,這些是工程研發。有些是基於數據作實時地在線實現,這些是算法工程師的工做。it

這些都是咱們的合做夥伴, 可是咱們又有咱們本身的定位, 跟這些都不一樣. 咱們應該爲咱們工做的中立性和科學性負責. 咱們須要有業務的思想, 可是咱們並非要作業務自己, 咱們但願作業務發展的催化劑。

▎DS 作什麼

我總結咱們作的事情,能夠抽象成三類 (1) 描述現狀 (2) 尋找規律 (3) 推進改進。這三類事是逐層推動地,可是都很重要。

DS 首先要描述現狀,也就是咱們常說的 「數數」。

當咱們連客觀現狀都描述不清楚的時候,是談不上尋找規律和推進改進的。咱們工做中大量的取數工,咱們作指標,作數據報表看板等等都是在這一類之中。可是爲何不少同窗對 「取數」工做有很大疑惑或者是以爲沒有成就感呢?我以爲這是由於咱們在被動地取數,或者說咱們並無把取數自己和本身業務的主線聯繫起來,而僅僅是在作填空題。

另外,我在數據分析十條中提到 「分析什麼問題,每每比用什麼方法更重要」,應用在取數上就是 「取什麼數」、「爲何取」每每比 「怎麼取」、「是多少」更重要。不少時候,從業務角度思考 「爲何取」就能給咱們更強的價值感,若是能主動去思考 「爲何取」,則更加會有參與感。雖然這是第一步,可是價值是極大的,若是不能幫助公司描述現狀,公司就是在盲目前進。這第一步就要求咱們的每位同窗有獨立思考尤爲是批判性思考的能力。

圖片描述

DS 還要尋找規律

數據分析的本質就是要尋找規律,尋找那些數據信息中隱含,可是別人還沒發現的規律。咱們常說的統計推斷、因果關係、增加推進、預測建模、實驗評估等等都是在尋找規律。這些規律就是咱們常說的 「洞見」。

固然, 有含金量的規律是不容易發現的, 這也正是咱們 DS 存在的價值. 若是咱們能看到的規律你們都能看到,那麼咱們就沒有提供價值;誰能挖掘的深, 誰能看到更本質的規律, 誰就提供了更大的價值,因此咱們的學術訓練、科學方法、實踐經驗、數據敏感度等等都是在幫咱們發現別人看不到的價值。因此我鼓勵你們在描述本身的工做的時候,出發點不該該是我用了什麼方法,而是我發現了什麼規律 ( 洞見 )。這要求咱們的每位同窗有很強的好奇心和堅決的信念

咱們描述現狀和尋找規律,最終的目的都是爲了推進改進,這也就是咱們常說的影響。我總結過DS的影響能夠分紅四類: (1) 改善重要指標 (2) 影響產品決策 (3) 影響操做流程 (4) 創造可持續解決方案。

若是咱們作了一些事,可是沒有直接或間接地實現這四類裏面的任何一類,那咱們要反過來思考下咱們是否是把時間花在了正確的地方。以及咱們之後要怎麼作,才能讓咱們的單位時間投入產出最大化?更理想的狀況,是在作事以前,先想一想 ( 若是是被動需求的話,問問需求方 ) 咱們要作的事會在哪些方面產生影響。要實現這些影響,還要求咱們的每位同窗有同理心和業務 (產品/運營/市場等)思惟,同時還要有精煉的能力,優秀的溝通技巧,說服的能力。理解了咱們影響力能夠發揮的四個維度,也就解釋了「 DS 存在的價值是什麼」。從心理學的概念,這至關於 DS 的 「超我」。

▎DS 要往哪一個方向發展

這至關因而DS 「自我」的問題。

我把這個問題總結成兩個方面 「能力建設」和 「文化建設」。在能力建設方向,打鐵還需自身硬。咱們要有能力作更加深刻的分析,應用更加科學的工具,讓別人作不了的東西咱們能作,別人看不到的規律咱們能看到。這裏要強調一點,就是能力不光是技術能力,還有業務思考的能力。咱們組織 Delta 計劃就是爲了幫助同窗們提升這種能力。咱們也鼓勵你們多經過行程學習小組、輪崗、和團隊裏的資深專家交流的方式。提升本身的能力。同時,咱們也鼓勵你們多站在業務的角度,思考數據能發揮什麼做用,。多從各業務 leader 那裏學習他們的思惟方式和角度,而後結合咱們的數據積累造成咱們本身的東西。

跟能力建設同等重要甚至更重要的是文化建設。咱們改變環境 ( 同事、公司、行業 ) 怎麼看待 DS ,首先要堅決咱們本身怎麼看待本身。這裏有自信的問題。咱們的價值是由咱們作的事情決定的 ( 自我 ) ,這個並不依賴於外界對咱們的認知和確定;咱們要提升本身的價值,本質上也是如何讓本身作的事情更有價值。有了自信,咱們纔能有方向去引導咱們的合做同事怎麼看待咱們,怎麼知道咱們能作什麼更有意義,別人怎麼看待本身,本質上反應地是本身怎麼看待本身。若是咱們本身就以爲本身應該取數,那在別人眼裏就是取數。若是咱們告訴別人,咱們的時間用在其餘 ( 更有價值 ) 的地方對業務幫助更大,那麼咱們和對方都有意願去這樣作。而咱們經過努力可以兌現這些,會讓對方更加認定咱們這個定位,造成正反饋。

你們在DS團隊趕上的問題,我若干年前在 Google 和 Facebook 都趕上過,可是經過咱們總體團隊的努力,逐步證實本身,在市場上樹立了 DS 的品牌和認知,並被市場上認定爲這個職能的標杆。DS 做爲一個職能,也得到跟工程、產品相相似的地位,近期屢次被評爲最有前景的工做。這個過程是逐步的,是須要時間的,也須要咱們一塊兒努力。

咱們在滴滴其實也是在作這麼一件事,DS 和數據驅動的理念在中國發展尚早,不少事情還停留在理論和感性層面,至關於硅谷若干年前的狀態。這也是爲何咱們這個部門的同窗面臨這麼大的迷茫,而咱們這些 leader 要幫助你們堅決方向,由於咱們是市場上引領這個職能的一羣人,在探索和拓展着這個職能的邊界,而這個過程註定是有挑戰的。和其餘職能不一樣,咱們的各位 leader 和基層同窗, 在作具體事情的同時,還在創造着這個職能的歷史。

▎數據分析十條

最後,我還想從新提一下我總結過的 「數據分析十條」,上面講的不少方面都在這十條裏面有反映:

  1. 分析師的核心能力是思辨 [DS作什麼]
  2. 對講真話負責,保持中立 [DS是誰]
  3. 論據充分,論證嚴謹,觀點簡明 [推進改進]
  4. 數據先於觀點,而不是觀點先於數據 [DS作什麼]
  5. 不要把問題複雜化,也不要害怕複雜度 [DS是誰, DS作什麼]
  6. 分析什麼問題,每每比用什麼方法更重要 [描述現狀]
  7. 好的分析師給別人輸入,而不僅是幫別人輸出 [文化建設]
  8. 分析沒有什麼價值,除非洞見改變了什麼其餘的東西 [非必要職能]
  9. 若是可能應該基於問題收集數據,而不僅是基於數據來問問題 [本文未提]
  10. 不是全部問題均可以分析出答案,以開放的心態採納其餘的觀點 [本文未提]

▍END
圖片描述

資深數據分析行業帶頭人,前 Facebook 數據分析總監,Instagram 數據分析負責人,Google長尾廣告增加負責人,在 Google 和 Facebook 的客戶端、廣告、社交網絡內容生產與消費等方面的數據應用有着普遍的經驗。

圖片描述

相關文章
相關標籤/搜索