好槍手是靠子彈喂出來的,好分析師是靠大量項目實踐沉澱出來的。微信
做者 | 老七
來源 | 鳥哥筆記
個人數據從業歷程是從諮詢公司切入,那裏有稍微學術點的指標體系和方法論。而後在數據服務公司應用,那裏有比較成熟的數據採集實現技術。然後在微博數據創業公司將以前的知識技能進行應用和商業。回過頭來看,那會的觀點暫時經得起這五年時間的考驗,同時也正是由於沒經歷過甲方公司的數據分析,因此彼時對業務的重要性感知不深,上文也就未有過多說起。佈局
借用下大數據的梗,「數據分析要懂業務」這句話就像「Teenage Sex」——人人都在談論,但沒誰知道究竟怎麼叫懂業務,人人都以爲別人都懂,因此人人都以爲本身懂業務。請容許我老調重彈,以我的視角闡述下什麼叫懂業務,不妨以別人家的產品爲例——對於頭條類的內容產品來講,他的業務模式無非是從(內容)生產到分發再到變現,從而實現從投入到盈利,再到盈利增加這樣一個商業閉環,要想將這個模式跑通,他就得有內容(生產者),有用戶(消費者),有平臺(消費平臺),有廣告(激勵生產者和平臺)。大數據
1)若是懂業務,你就不會在日活出現下行趨勢時單純提出加大廣告投放這樣誰都知道的建議;你就不會在生產者因競品提高激勵費用而出現流失苗頭時,只是輕描淡寫的報一下同環比;你就不會在關於廣告的反饋量異常提高時粗暴建議業務側全局減小廣告頻率….優化
2)若是懂業務,你就會知道數據工做該如何推動。第一階段應該是基礎數據建設,保證數據收集的規範化、全景化和擴展化,保障從打點->收集->清洗->統計->入庫這個數據生產流程的效率和穩定。spa
第二階段重點關注種子用戶的數據表現,用戶對產品哪些功能使用不暢,對哪些品類的內容更加有偏心,什麼樣渠道的用戶質量更高,並將以上結論同步輸出給業務側,並持續進行PDCA循環,直至經過留存率測算出來的life-time足夠支持進入爆發期。設計
在爆發期的分析重點就是不斷提高運轉效率,好比根據用戶偏好特徵進行定向組織生產,繼而擴大分發場景,從APP內分發再到APP外分發,不斷提升單篇內容的分發效率;優化產品的欄目佈局、功能按鈕等動線設計,知足不一樣人羣的使用偏好,提升「坪效、人效」;3d
從買用戶到等用戶再到漲用戶,目前產品的核心用戶羣體是誰,在社會人口這個大盤裏是否已滲透完全,若是沒有,經過什麼渠道能夠「捕捉」到他們,以及經過分享/轉發這些策略的設計,實現用戶的自增加。blog
在第二階段的種種目的都是爲了避免斷放大用戶與內容的規模效應,爲商業化作準備。遊戲
第三階段的分析重點則是關注商業側表現,內容不管是自產也好,仍是UGC也罷,都是有成本的,成本換做了流量,流量又經過商業化實現了變現,因此須要經過數據優化當前的廣告形式和策略,幫助金主爸爸找到最匹配的用戶,以及讓用戶發現最須要的廣告,從而實現ROI的最大化;rem
第四階段則應關注創新發展,國內同行當前的發展模式都有哪些,以及各自的差別化競爭點,國外是否有相似的行業以及當下現狀是如何,用戶還有哪些延伸需求沒有獲得知足,內容行業的將來發展趨勢是什麼,以及可能會遇到的法律法規等政策風險。
3)若是懂業務,你就會知道在相應的階段老闆的關注點是什麼,你就會設計出更符合業務視角的報表,經過相應的專題分析,解答老闆還未開口的「需求」。
4)若是懂業務,你就會想到首先要了解各業務角色的KPI,對於團隊協做來講,最有力的方法就是驅之以利,而非驅之以理,當業務人員知道大家是利益共同體的時候,良好的協做也就有了保障。……
說了這麼多,那問題來了,如何檢驗本身是否懂業務,我的有個小經驗,就是看你的主要時間花費和產出都在哪裏?若是懂業務,你的主要產出就必定不會是提數,由於老闆&業務部門知道,讓你提數那就是浪費公司人效&損害本身利益。不然,分析就僅僅只能是提數。
引用下百度百科的解釋,「數據就是數值,他是咱們經過觀察、實驗或計算得出的結果。數據有不少種,最簡單的就是數字」數據的本質是數值,只是屬於結果而已,要想改變結果,只能去尋找因,從因上作改變,才能引發數變。
這段話可能不太好理解,舉一個你們都知道的流水萬能公式——流水=日活購買率人均購買金額,這個公式還能夠繼續往下拆,並將拆解後的因子交給不一樣的業務小組負責,美名其曰---KPI。
老司機都知道,這個公式最大的意義是跟蹤和監控,而不能做爲執行目標,初期可能還行,但到了穩按期後,日活一旦大幅提高,購買率和人均購買金額反而出現了降低;業務作了不少優化,好不容易購買率獲得了提高,購買金額反而下去了;爲了人均購買金額達標,運營推薦了不少高價商品,結果購買率卻又降低了…爲何?
由於流水只是個結果表現,這個結果是由用戶決策產生的,決定流水的正確因子應該是用戶的需求強度,購買力,以及相應購買力用戶與相應價格檔商品的匹配程度。若是不從因果關係上想解決辦法,而只在當前的存量購買力下,追求各個僞因子,就會出現按下葫蘆浮起了瓢。尤爲在甲方業務環境裏,各個小組都是緊密圍繞在覈心KPI的基本路線,若是數據側陷入到各業務小組的KPI分析需求裏而沒有及時糾錯,那後果將萬劫不復。
再舉一個例子,下圖是業務裏經常使用的數據報表視圖,並隨着業務的迭代和細化,出現各類報表堆砌,潑盆冷水,這種報表哪怕就是有幾萬份,哪怕就是進行分鐘級別的異動監控,可能對業績提高也於事無補,該跌仍是跌。
咱們不妨將視圖變換一下:
以上表頭只是示意,並無詳細展開,主要思路是將結果型報表變換成過程型報表,以用戶視角將整個報表分紅基本屬性 、興趣偏好 、使用特徵 、商業貢獻四個單元。
基本屬性主要是以新增日期,渠道,機型,性別,年齡等爲表明的用戶基礎描述。興趣偏好是用戶在使用產品以後表現出來的特性,好比喜歡卡牌、RPG等品類遊戲。
使用特徵則是用戶在使用產品時留下的數據行爲,好比瀏覽/點擊/搜索次數。商業貢獻則是衡量用戶對商業化的貢獻,好比購買次數,購買金額。商業貢獻結合基礎屬性其實就是用戶LTV的整個監控。
有了這種視圖後,就等於有了自變量與因變量,就能夠回到咱們熟悉的因子,迴歸,判別這些多變量分析方法上來,至於RFM、CRM、渠道評估/反做弊等解決方案的產出更不在話下。
熟悉業務的好處是能夠有相同的對話語境和立場,但弊端就是經常因走得太近,走得太快而忘記數據的本質,一個優秀的分析師是須要創建起一套屬於本身的分析系統,其中,很重要的一個環節是自我糾錯機制,這點,我也是在摸索。
伴隨着人口紅利消解,互聯網大盤流量增加接近上限這個大背景,增加黑客(Growth Hacker)的概念如今愈來愈火,這裏,我想說兩點,
1)對於什麼微信裂變,社羣運營,用戶補貼,拼團這些來講,都是屬於增加手段,手段是有有效期和環境的。他的有效每每是在透支行業平均成功率的基礎之上,畢竟後來者的複製會加快人羣防疫力的構建, 不只會慢慢失效,還有可能會對自身形成傷害,在模仿手段的這個賽道里恐怕只有第一,沒有第二。
電商行業有句打油詩是這麼說的——「用戶促活一句話:推送信息把券發,有事沒事發短信。您要登錄把禮拿,優質產品在秒殺,再不來就沒有啦~要是客戶不買帳,直接拿券頭上砸」
這種生搬硬套無腦跟風作增加的後果就是成本愈來愈高,效果愈來愈差。用戶的購買決策體系發生紊亂,商家的訂價權也受到質疑,「價格太虛了,啥時候有優惠啥時候再來買,反正也不着急」。薅羊毛的用戶愈來愈多,平臺陷入了飲酖止渴的尷尬境地。
2)增加黑客正確的姿式應當是數據先行,數據的優點是能夠客觀的,全局的,經過一組指標還原用戶場景和動機,進而概括演繹->找到差別->抓住增加點。再往大了說,數據增加還應包括用戶定位,產品設計,價格策略等一系列全鏈條環節,這個後面有機會再聊。
同時增加類項目能發揮多大效能,還取決兩個前提:
下圖是根據淘寶親情帳號的公關稿以及一組假數據結合的增加案例:
如上所說,流水=日活購買率購買金額,在存量購買力下,單純提升某一個因子對總流水的提高都於事無補,但能夠作的是經過數據還原用戶的需求場景,繼而進行場景再造,健康的將業績目標進行穩定增加。
數據分析師是個孤獨的圈子,孤獨在無法跟同行交流和切磋,泛泛談沒有價值,說來講去就是那麼幾點——趨勢/細分/對比/多變量,有價值的是背後各類方法的嘗試以及遇到的坑,不免不涉及業務細節,也就無法展開進行描述,不得已用了不少別人家的案例,有不太清楚的地方歡迎進行具體交流。
至於數據分析的前景,無需多作宣貫,只提一點,當像充電寶,單車,咖啡,甚至汽車、大賣場這些傳統行業都逐漸開始互聯網化的時候,意味着互聯網從輕資產走向重資產時代,你以爲企業還會不重視精細化運營麼?
產品有bug咱們能夠及時回滾,可智能硬件的生產製造都是有成本的,一旦生產多了賣不出去就成了庫存積壓,生產少了用戶買不到體驗就很差,至於新零售的本質就更是提升人貨場的週轉效率,這些可都是數據問題啊。效率運營的精細化程度可能逐漸成爲將來產品間的護城河。
好槍手是靠子彈喂出來的,好分析師是靠大量項目實踐沉澱出來的,上圖是根據資料以及本身的理解進行的概括提煉—數據應用的三層價值模型&數據人員能力成長體系,耐得住寂寞,才能守得住繁華,在數據分析這個道路,咱們一塊兒夢想與前行。