運營入門:從0到1搭建數據分析知識體系

對於數據分析,我發現不少運營都有這樣一些困惑:html

  • 不知道從哪裏獲取數據;
  • 不知道用什麼樣的工具;
  • 不清楚分析的方法論和框架;
  • 大部分的數據分析流於形式;

……數據庫

其實,數據分析並無你們想象的那麼難!接觸了不少數據從業者,總結了這篇文章,但願對有志於學習數據分析的運營同窗有所幫助。編程

1、概念:數據和數據分析

其實你們一直都在接觸數據和數據分析,可是對於二者具體的定義又很難說清楚。我曾經作過一個調查,問一些運營同窗,下面5個選項哪些屬於「數據」概念的範圍。後端

1

圖1:哪些屬於「數據」概念範圍瀏覽器

大部分人都知道把「4.報表」選上,可是很難有人會認爲上面5個選項都是。其實這反映了一個很廣泛的現象:不少人都會先入爲主,認爲數據就是各類表格、各類數字,例如excel報表、各類數據庫。其實這是一個錯誤或者說有誤差的認識,它會使得咱們對數據的認識變得很狹隘。微信

(一)什麼是數據?

數據(data)是描述事物的符號記錄,是構成信息或者知識的原始材料。這種哲學層次的定義,讓數據的範圍極大豐富,也符合目前「大數據」發展的須要。試想一下,如今不少搜索引擎作的 「圖片識別」、「音頻識別」 難道不是數據分析的一部分嗎?框架

做爲一名互聯網企業的運營從業者,咱們接觸到的數據可能沒有那麼複雜,可是也有不少類別。機器學習

2

圖2:互聯網企業運營從業者可能接觸到的數據編程語言

從數據的來源來看,能夠分爲企業外部數據和內部數據。外部數據主要包括社會人口、宏觀經濟、新聞輿情和市場調研數據;內部數據包括用戶行爲數據、服務端日誌數據、CRM與交易數據。不一樣數據的獲取途徑、分析方法、分析目的都不經相同,不一樣行業、不一樣企業在實際分析中也都各有偏好。函數

那麼咱們常見的「信息」和「數據」有何不一樣?

數據是信息的載體和表現形式;信息是數據的內涵,信息加載於數據之上。以書本和知識爲例,書本屬於數據概念範疇,知識屬於信息概念範疇;書本是知識的一種載體和表現形式,知識是書本的內涵和昇華。

(二)什麼是數據分析?

數據分析是指從數據中提取有用的信息,並指導實踐。

這裏有兩個點須要注意:首先,咱們須要提取的是有用的信息,而不是自嗨;其次,這些信息須要用來指導實踐,而不是流於形式。

2、思路:方法論和方法

不少新人入門數據分析的時候,要麼鬍子眉毛一把抓,要麼無從下手。這都是缺乏分析思路的表現,須要宏觀的方法論和微觀的方法來指導。

那麼方法論和方法有什麼區別?

方法論是從宏觀角度出發,從管理和業務的角度提出的分析框架,指導咱們接下來具體分析的方向。方法是微觀的概念,是指咱們在具體分析過程當中使用的方法。

(一)方法論

數據分析的方法論不少,這裏我給你們介紹一些常見的框架。

  • PEST分析法:從政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology)四個方面分析內外環境,適用於宏觀分析。
  • SWOT分析法:從優點(Strength)、劣勢(Weakness)、機遇(Opportunity)、威脅(Threat)四個方面分析內外環境,適用於宏觀分析。
  • 5W2H分析法:從Why、When、Where、What、Who、How、How much 7個常見的維度分析問題。
  • 4P理論:經典營銷理論,認爲產品(Product)、價格(Price)、渠道(Place)和促銷(Promote)是影響市場的重要因素。
  • AARRR:增加黑客的海盜法則,精益創業的重要框架,從獲取(Acquisition)、激活(Activation)、留存(Retention)、變現(Revenue)和推薦(Referral)5個環節增加。

數據分析的方法論不少,這裏不能一一列舉;沒有最好的方法論,只有最合適的。下面我詳細介紹一下 AARRR 方法論,對於精益化運營、業務增加的問題,這個方法論很是契合。

3

圖3:AARRR方法論

對於互聯網產品而言,用戶具備明顯的生命週期特徵,下面我以一個O2O行業的APP爲例闡述一下。

首先經過各類線上、線下的渠道獲取新用戶,下載安裝APP。安裝完APP後,經過運營手段激活用戶;好比說首單免費、代金券、紅包等方式。經過一系列的運營使部分用戶留存下來,而且給企業帶營收。在這個過程當中,若是用戶以爲這個產品不錯,可能推薦給身邊的人;或者經過紅包等激勵手段鼓勵分享到朋友圈等等。

須要注意的是,這5個環節並非徹底按照上面順序來的;運營能夠根據業務須要靈活應用。 AARRR的五個環節均可以經過數據指標來衡量與分析,從而實現精益化運營的目的;每一個環節的提高均可以有效增加業務。咱們下面的分析也是圍繞這個方法論展開的。

(二)方法

根據運營工做的實際須要,在參考了 GrowingIO 陳明的文章《一名優秀的數據分析師是怎樣煉成的》基礎上,我整理了7種分析方法。藉助常見的網站/APP數據分析產品,咱們很是快速的完成這7種分析。

1.趨勢分析

趨勢分析是最簡單、最基礎,也是最多見的數據監測與數據分析方法。一般咱們在數據分析產品中創建一張數據指標的線圖或者柱狀圖,而後持續觀察,重點關注異常值。

在這個過程當中,咱們要選定第一關鍵指標(OMTM,One Metric That Matter),而不要被虛榮指標(vanity metrics )所迷惑。

以社交類APP爲例,若是咱們將下載量做爲第一關鍵指標,可能就會走偏;由於用戶下載APP並不表明他使用了你的產品。在這種狀況下,建議將DAU(Daily Active Users,日活躍用戶)做爲第一關鍵指標,並且是啓動而且執行了某個操做的用戶才能算上去;這樣的指標纔有實際意義,運營人員要核心關注這類指標。

2.多維分解

多維分解是指從業務需求出發,將指標從多個維度進行拆分;這裏的維度包括但不限於瀏覽器、訪問來源、操做系統、廣告內容等等。

爲何須要進行多維拆解?有時候一個很是籠統或者最終的指標你是看不出什麼問題來的,可是進行拆分以後,不少細節問題就會浮現出來。

舉個例子,某網站的跳出率是0.4七、平均訪問深度是4.3九、平均訪問時長是0.55分鐘。若是你要提高用戶的參與度,顯然這樣的數據會讓你無從下手;可是你對這些指標進行拆解以後就會發現不少思路。

下面展現的是一個產品在不一樣操做系統下的用戶參與度指標數據。

4

圖4:不一樣操做系統用戶的參與程度

仔細觀察的話,你會發現移動端平臺(Android、Windows Phone、IOS)的用戶參與度極差,表如今跳出率極高、訪問深度和平均訪問時長很低。這樣的話你就會發現問題,是否是咱們的產品在移動端上沒有作優化致使用戶體驗很差?在這樣一個移動互聯網時代,這是很是重要的一個問題。

3.用戶分羣

用戶分羣主要有兩種分法:維度和行爲組合。第一種根據用戶的維度進行分羣,好比從地區維度分,有北京、上海、廣州、杭州等地的用戶;從用戶登陸平臺進行分羣,有PC端、平板端和手機移動端用戶。第二種根據用戶行爲組合進行分羣,好比說每週在社區簽到3次的用戶與每週在社區簽到少於3次的用戶的區別,這個具體的我會在後面的留存分析中介紹。

4.用戶細查

正如前面所說的,用戶行爲數據也是數據的一種,觀察用戶在你產品內的行爲路徑是一種很是直觀的分析方法。在用戶分羣的基礎上,通常抽取3-5個用戶進行細查,便可覆蓋分羣用戶大部分行爲規律。

咱們以一個產品的註冊流程爲例:

5

圖5:用戶行爲軌跡

用戶經歷了以下的操做流程:【訪問官網】-【點擊註冊】-【輸入號碼】-【獲取驗證碼】。原本是很是流暢的一個環節,可是卻發現一個用戶連續點擊了3次【獲取驗證碼】而後放棄提交。這就奇怪了,用戶爲何會屢次點擊驗證碼呢?

這個時候我建議您去親自體驗一下您的產品,走一遍註冊流程。你會發現,點擊【獲取驗證碼】後,常常遲遲收不到驗證碼;而後你又會不斷點擊【獲取驗證碼】,因此就出現了上面的狀況。絕大多數產品都或多或少存在一些反人類的設計或者BUG,經過用戶細查能夠很好地發現產品中存在的問題而且及時解決。

5.漏斗分析

漏斗是用於衡量轉化效率的工具,由於從開始到結束的模型相似一個漏斗,於是得名。

漏斗分析要注意的兩個要點:第一,不但要看整體的轉化率,還要關注轉化過程每一步的轉化率;第二,漏斗分析也須要進行多維度拆解,拆解以後可能會發現不一樣維度下的轉化率也有很大差別。

某企業的註冊流程採用郵箱方式,註冊轉化率一直很低,才27%;經過漏斗分析發現,主要流失在【提交驗證碼】的環節。

6

圖6:註冊轉化率

通過了解發現,郵箱驗證很是容易出現註冊郵箱收不到郵件的狀況,緣由包括郵件代理商被屏蔽、郵件含有敏感字被納入垃圾郵箱、郵件送達時間過長等等。既然這麼多不可控因素影響註冊轉化率,那就換一種驗證方式。換成短信驗證後,整體轉化率提高到了43%,這是很是大的一個增加。

6.留存分析

留存,顧名思義就是新用戶留下來持續使用產品的含義。衡量留存的常見指標有:第二天留存率、7日留存率、30日留存率等等。咱們能夠從兩個方面去分析留存,一個是新用戶的留存率,另外一個是產品功能的留存。

7

圖7:兩種用戶羣體的留存差別

第一個案例:以社區網站爲例,「每週簽到3次」的用戶留存率明顯高於「每週簽到少於3次」的用戶。簽到這一功能在無形中提高了社區的用戶的粘性和留存率,這也是不少社羣或者社區主推這個功能的緣由。

8

圖8:留存魔法數字

第二個案例:首次註冊微博,微博會向你推薦關注10個大V;首次註冊LinkedIn,LinkedIn會向你推薦5個同事;申請信用卡時,髮卡方會說信用卡消費滿4筆便可抽取【無人機】大獎;不少社交產品規定,每週簽到5次,用戶能夠得到雙重積分或者虛擬貨幣。

在這裏面「關注10個大V」、「關注5個同事」、「消費4筆」、「簽到5次」就是我想說的Magic Number,這些數字都是經過長期的數據分析或者機器學習的方式發現的。實踐證實,符合這些特徵的用戶留存度是最高的;運營人員須要不斷去push,激勵用戶達到這個標準,從而提高留存率。

7.A/B測試與A/A測試

A/B測試是爲了達到一個目標,採起了兩套方案,一組用戶採用A方案,一組用戶採用B方案。經過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞。 在A/B測試方面,谷歌是竭盡全力地嘗試;對於搜索結果的顯示,谷歌會制定多種不一樣的方案(包括文案標題,字體大小,顏色等等),不斷來優化搜索結果中廣告的點擊率。

這裏須要注意的一點,A/B測試以前最好有A/A測試或者相似準備。什麼是A/A測試?A/A測試是評估兩個實驗組是不是處於相同的水平,這樣A/B測試纔有意義。其實這和學校裏面的控制變量法、實驗組與對照組、雙盲試驗本質同樣的。

3、流程:宏觀、中觀和微觀

有了具體的分析方法還不夠,運營要作好數據分析還須要一個清晰的流程。在這裏我從宏觀、中觀和微觀三個層次給你們介紹一下。

(一)宏觀

1.中國古代樸素的分析哲學

其實數據分析自古有之,中國古代不少名人從事的其實就是數據分析的工做;他們的名稱可能不是數據分析師,更多的是「丞相」、「軍師」、「謀士」,如張良、管仲、蕭何、孫斌、鬼谷子、諸葛亮。

他們經過 「歷史統計」-「經驗總結」-「預測將來」 爲本身的組織創造了極大的價值,這是中國古代樸素的分析哲學的重要內容。

2.精益創業的MVP理念

風靡硅谷的精益創業,它推崇MVP(最簡化可行產品)的理念,經過小步快跑的方式來不斷優化產品、增加用戶。

9

圖9:構建-衡量-優化

在運營工做中,咱們要大膽嘗試,將想法轉化成產品和運營方法。而後分析其中的數據,衡量產品或者運營的效果。若是好的話保持並大力推廣,若是很差的話總結問題及時改進。在「構建-「衡量」-「學習」的不斷循環中逐漸優化,這個流程是很是適合運營工做的。

(二)中觀

《誰說菜鳥不會數據分析》書中介紹了更爲具體的分析流程:1.明確分析目的和思路 →2.數據收集 →3.數據處理 →4.數據分析 →5.數據展示 →6.報告撰寫。

這個流程只是從「數據」的角度闡述了先後的流程,並未結合業務實際;並且它將數據分析的落腳點定位於「報告撰寫」是具備誤導性的,由於數據分析的最終目的是爲了指導實踐,而不是寫一份報告。 可是這個流程仍具備參考價值,尤爲是 「明確分析目的和思路」 對於新手入門具備必定的指導意義。

(三)微觀

下面介紹的是一個很是詳細的分析流程,藉助於必定的分析工具,咱們能夠按照這個思路對您的網站/APP進行細緻入微的分析。

10

圖10:微觀數據分析流程

這是GrowingIO商務分析師檀潤洋在《提升用戶留存,產品、市場和運營都有哪些方法》中介紹的流程,我認爲適用於大部分的運營數據分析。

它的前提是用數據分析工具作好數據採集和監控工做,把精力集中在業務分析上。這個流程的核心是「MVP」的理念,「發現問題」-「設計實驗」-「分析結果」,經過數據來不斷優化產品和運營。

4、應用:體系和分析

(一)案例1:搭建數據分析體系

小張今年剛畢業,在某公司從事新媒體工做,負責微信的平常運營。小張並不清楚微信運營的核心目的,嘗試了不少方法,原創、翻譯、改寫了不少文章發佈在微信上,可是閱讀量時高時低,整體通常。

經理讓小張想辦法改進一下微信運營,提升微信的粉絲數和閱讀數;可是張三毫無頭緒,無從下手。這是不少運營真實的寫照,瑣碎的工做容易讓人忘記思考,這極可能就發生在你個人身邊。

咱們從數據分析的角度對這個案例進行了診斷,總結了小張存在的這些問題:

  • 不清楚本身須要關注哪些核心指標;
  • 不清楚目標用戶的特徵(用戶屬性、用戶畫像等);
  • 對本身過往工做缺少系統分析(數據採集、監測和分析)。

從業務增加的角度出發,我給小張量身定作了一套數據分析體系,配合其內容工做的開展。

第一點,內容定位。

運營須要明確知道本身的目標或者KPI,而後選擇一個核心關鍵指標(OMTM)進行監測。若是是創業公司,初期可能須要拉新,那麼核心指標是註冊用戶數或者新訪問用戶數。若是是資訊媒體,注重影響力和覆蓋面,那麼核心指標應該是微信閱讀數或者網頁PV。

第二點,用戶畫像。

不管是哪種運營崗位,都須要明確知道本身的(目標)用戶是那些人?這些人都有哪些特徵,他們的關注點和痛點是什麼?若是你的用戶是產品經理,那麼能夠嘗試爬蟲抓取產品經理網站上有關的問題,而後作文本分析:這是定量層面的分析。同時,經過調查訪問和問卷調研,獲取更加深刻的用戶特徵信息:這是從定性層面的分析。

第三點,持續監測。

藉助數據分析工具,對核心關鍵指標(OMTM)進行持續監測。對於指標異常狀況,咱們須要及時分析和改進。

第四點,數據分析。

統計和分析過往內容的數據,找出哪些內容、哪些標題、哪些形式、哪些渠道的效果更好,而後朝這方面不斷優化。

(二)案例2:分析業務核心指標

電子郵件營銷是如今不少企業仍在採用的營銷和運營方式,某互聯網金融企業經過EDM給新用戶(有郵件地址可是未註冊用戶)發送激活郵件。一直以來註冊轉化率維持在20%-30%之間,8月18日註冊轉化率暴跌,以後一直維持在10%左右。

11

圖11:EDM渠道註冊轉化率暴跌

這是一個很是嚴重的衰退,須要當即排查緣由。EDM渠道註冊轉化率涉及到太多的因素,須要一個一個排查,數據分析師幫運營羅列了可能的緣由:

  • 技術緣由:ETL(數據抽取、轉化、載入)出現問題,致使後端數據沒有及時呈如今BI報表中;
  • 宏觀緣由:季節性因素(節假日等),其他郵件衝擊(其他部門也給用戶發郵件稀釋了用戶的注意力);
  • 微觀緣由:郵件的標題、文案、排版設計,CTA設計,註冊流程設計。

一個簡單的業務指標,會影響到它的因素多是多種多樣的,因此咱們須要對可能涉及到的因素進行精細化衡量才能不斷優化。最後發現,產品經理在註冊環節添加了『綁定信用卡』,致使註冊轉化率大幅度降低。

5、學習:業務、工具和資源

(一)業務層面

數據分析並無想象中的高不可及,掌握好相應的概念、思路、流程,運營均可以作好數據分析。

這裏要着重強調一點,數據分析的目的是指導業務實踐;脫離實踐的數據分析、爲分析而分析的數據分析都是在耍流氓。

不一樣於職業的數據分析師和數據科學家,運營人員作好數據分析的前提是嫺熟的業務理解。從業務的角度來講,數據不是數字,它是用戶的心聲。運營人員要從數據中發現問題,不斷優化,提高用戶體驗、爲用戶創造更多的價值。

(二)工具層面

磨刀不誤砍柴工,作好數據分析工具必不可少。我彙總了下面幾種工具,運營能夠結合本身的實際須要採用。

  • Excel 是最多見、最基礎的數據分析工具,Excel 裏面的圖表、函數、透視表能知足你們基本的需求。Access 是微軟 office 系列套裝的一部分,是一種小型的關係數據庫;當excel數據量很大、表格之間各類關聯、查詢、更新頻繁的時候,Access就是一種很是不錯的選擇。
  • Python是一種高級的編程語言,近年來發展很快,它能夠用來作數據分析、編程或爬蟲;R語言是一種數據分析工具,在統計學中普遍使用。目前,Python被普遍用來編寫爬蟲程序,獲取網上的信息,這是對運營人員很是有幫助的。
  • Google Analytics、百度統計、友盟是常見的網站流量分析工具,Mixpanel、Heap、GrowingIO屬於用戶行爲數據分析工具,較前者功能更加豐富、分析更細緻。

(三)資源層面

運營入門數據分析,並不須要學習多麼複雜的數學知識理論,更多的是將業務操做和數據分析結合起來。我這裏推薦兩個網站和兩本書,但願有幫助。

  1. 數據分析網(http://www.afenxi.com/ ):覆蓋統計理論、數據分析方法、業務分析等內容。
  2. GrowingIO博客(https://blog.growingio.com/ ):GrowingIO數據分析、增加實踐等內容。
  3. 《誰說菜鳥不會數據分析》:數據分析入門知識彙總。
  4. 《精益數據分析》:從精益創業的角度,詮釋業務增加的分析方法和前言案例。

 

做者:官世強,關注內容營銷和數據分析。我的公衆號:內容運營那些事。

Refer:

[1] 運營入門,從0到1搭建數據分析知識體系

http://bit.ly/2fP28Xj

[2] 帶你走進網站分析的世界!

http://bit.ly/2gzpFwD

[3] 關於數據分析那些事,看這一文章就夠了

http://bit.ly/2gN6JgU

[4] 百度內部培訓資料PPT:數據分析的道與術

http://bit.ly/2i1p9Lr

相關文章
相關標籤/搜索