對於數據分析,我發現不少運營都有這樣一些困惑:html
……數據庫
其實,數據分析並無你們想象的那麼難!接觸了不少數據從業者,總結了這篇文章,但願對有志於學習數據分析的運營同窗有所幫助。編程
其實你們一直都在接觸數據和數據分析,可是對於二者具體的定義又很難說清楚。我曾經作過一個調查,問一些運營同窗,下面5個選項哪些屬於「數據」概念的範圍。後端
圖1:哪些屬於「數據」概念範圍瀏覽器
大部分人都知道把「4.報表」選上,可是很難有人會認爲上面5個選項都是。其實這反映了一個很廣泛的現象:不少人都會先入爲主,認爲數據就是各類表格、各類數字,例如excel報表、各類數據庫。其實這是一個錯誤或者說有誤差的認識,它會使得咱們對數據的認識變得很狹隘。微信
數據(data)是描述事物的符號記錄,是構成信息或者知識的原始材料。這種哲學層次的定義,讓數據的範圍極大豐富,也符合目前「大數據」發展的須要。試想一下,如今不少搜索引擎作的 「圖片識別」、「音頻識別」 難道不是數據分析的一部分嗎?框架
做爲一名互聯網企業的運營從業者,咱們接觸到的數據可能沒有那麼複雜,可是也有不少類別。機器學習
圖2:互聯網企業運營從業者可能接觸到的數據編程語言
從數據的來源來看,能夠分爲企業外部數據和內部數據。外部數據主要包括社會人口、宏觀經濟、新聞輿情和市場調研數據;內部數據包括用戶行爲數據、服務端日誌數據、CRM與交易數據。不一樣數據的獲取途徑、分析方法、分析目的都不經相同,不一樣行業、不一樣企業在實際分析中也都各有偏好。函數
那麼咱們常見的「信息」和「數據」有何不一樣?
數據是信息的載體和表現形式;信息是數據的內涵,信息加載於數據之上。以書本和知識爲例,書本屬於數據概念範疇,知識屬於信息概念範疇;書本是知識的一種載體和表現形式,知識是書本的內涵和昇華。
數據分析是指從數據中提取有用的信息,並指導實踐。
這裏有兩個點須要注意:首先,咱們須要提取的是有用的信息,而不是自嗨;其次,這些信息須要用來指導實踐,而不是流於形式。
不少新人入門數據分析的時候,要麼鬍子眉毛一把抓,要麼無從下手。這都是缺乏分析思路的表現,須要宏觀的方法論和微觀的方法來指導。
那麼方法論和方法有什麼區別?
方法論是從宏觀角度出發,從管理和業務的角度提出的分析框架,指導咱們接下來具體分析的方向。方法是微觀的概念,是指咱們在具體分析過程當中使用的方法。
數據分析的方法論不少,這裏我給你們介紹一些常見的框架。
數據分析的方法論不少,這裏不能一一列舉;沒有最好的方法論,只有最合適的。下面我詳細介紹一下 AARRR 方法論,對於精益化運營、業務增加的問題,這個方法論很是契合。
圖3:AARRR方法論
對於互聯網產品而言,用戶具備明顯的生命週期特徵,下面我以一個O2O行業的APP爲例闡述一下。
首先經過各類線上、線下的渠道獲取新用戶,下載安裝APP。安裝完APP後,經過運營手段激活用戶;好比說首單免費、代金券、紅包等方式。經過一系列的運營使部分用戶留存下來,而且給企業帶營收。在這個過程當中,若是用戶以爲這個產品不錯,可能推薦給身邊的人;或者經過紅包等激勵手段鼓勵分享到朋友圈等等。
須要注意的是,這5個環節並非徹底按照上面順序來的;運營能夠根據業務須要靈活應用。 AARRR的五個環節均可以經過數據指標來衡量與分析,從而實現精益化運營的目的;每一個環節的提高均可以有效增加業務。咱們下面的分析也是圍繞這個方法論展開的。
根據運營工做的實際須要,在參考了 GrowingIO 陳明的文章《一名優秀的數據分析師是怎樣煉成的》基礎上,我整理了7種分析方法。藉助常見的網站/APP數據分析產品,咱們很是快速的完成這7種分析。
1.趨勢分析
趨勢分析是最簡單、最基礎,也是最多見的數據監測與數據分析方法。一般咱們在數據分析產品中創建一張數據指標的線圖或者柱狀圖,而後持續觀察,重點關注異常值。
在這個過程當中,咱們要選定第一關鍵指標(OMTM,One Metric That Matter),而不要被虛榮指標(vanity metrics )所迷惑。
以社交類APP爲例,若是咱們將下載量做爲第一關鍵指標,可能就會走偏;由於用戶下載APP並不表明他使用了你的產品。在這種狀況下,建議將DAU(Daily Active Users,日活躍用戶)做爲第一關鍵指標,並且是啓動而且執行了某個操做的用戶才能算上去;這樣的指標纔有實際意義,運營人員要核心關注這類指標。
2.多維分解
多維分解是指從業務需求出發,將指標從多個維度進行拆分;這裏的維度包括但不限於瀏覽器、訪問來源、操做系統、廣告內容等等。
爲何須要進行多維拆解?有時候一個很是籠統或者最終的指標你是看不出什麼問題來的,可是進行拆分以後,不少細節問題就會浮現出來。
舉個例子,某網站的跳出率是0.4七、平均訪問深度是4.3九、平均訪問時長是0.55分鐘。若是你要提高用戶的參與度,顯然這樣的數據會讓你無從下手;可是你對這些指標進行拆解以後就會發現不少思路。
下面展現的是一個產品在不一樣操做系統下的用戶參與度指標數據。
圖4:不一樣操做系統用戶的參與程度
仔細觀察的話,你會發現移動端平臺(Android、Windows Phone、IOS)的用戶參與度極差,表如今跳出率極高、訪問深度和平均訪問時長很低。這樣的話你就會發現問題,是否是咱們的產品在移動端上沒有作優化致使用戶體驗很差?在這樣一個移動互聯網時代,這是很是重要的一個問題。
3.用戶分羣
用戶分羣主要有兩種分法:維度和行爲組合。第一種根據用戶的維度進行分羣,好比從地區維度分,有北京、上海、廣州、杭州等地的用戶;從用戶登陸平臺進行分羣,有PC端、平板端和手機移動端用戶。第二種根據用戶行爲組合進行分羣,好比說每週在社區簽到3次的用戶與每週在社區簽到少於3次的用戶的區別,這個具體的我會在後面的留存分析中介紹。
4.用戶細查
正如前面所說的,用戶行爲數據也是數據的一種,觀察用戶在你產品內的行爲路徑是一種很是直觀的分析方法。在用戶分羣的基礎上,通常抽取3-5個用戶進行細查,便可覆蓋分羣用戶大部分行爲規律。
咱們以一個產品的註冊流程爲例:
圖5:用戶行爲軌跡
用戶經歷了以下的操做流程:【訪問官網】-【點擊註冊】-【輸入號碼】-【獲取驗證碼】。原本是很是流暢的一個環節,可是卻發現一個用戶連續點擊了3次【獲取驗證碼】而後放棄提交。這就奇怪了,用戶爲何會屢次點擊驗證碼呢?
這個時候我建議您去親自體驗一下您的產品,走一遍註冊流程。你會發現,點擊【獲取驗證碼】後,常常遲遲收不到驗證碼;而後你又會不斷點擊【獲取驗證碼】,因此就出現了上面的狀況。絕大多數產品都或多或少存在一些反人類的設計或者BUG,經過用戶細查能夠很好地發現產品中存在的問題而且及時解決。
5.漏斗分析
漏斗是用於衡量轉化效率的工具,由於從開始到結束的模型相似一個漏斗,於是得名。
漏斗分析要注意的兩個要點:第一,不但要看整體的轉化率,還要關注轉化過程每一步的轉化率;第二,漏斗分析也須要進行多維度拆解,拆解以後可能會發現不一樣維度下的轉化率也有很大差別。
某企業的註冊流程採用郵箱方式,註冊轉化率一直很低,才27%;經過漏斗分析發現,主要流失在【提交驗證碼】的環節。
圖6:註冊轉化率
通過了解發現,郵箱驗證很是容易出現註冊郵箱收不到郵件的狀況,緣由包括郵件代理商被屏蔽、郵件含有敏感字被納入垃圾郵箱、郵件送達時間過長等等。既然這麼多不可控因素影響註冊轉化率,那就換一種驗證方式。換成短信驗證後,整體轉化率提高到了43%,這是很是大的一個增加。
6.留存分析
留存,顧名思義就是新用戶留下來持續使用產品的含義。衡量留存的常見指標有:第二天留存率、7日留存率、30日留存率等等。咱們能夠從兩個方面去分析留存,一個是新用戶的留存率,另外一個是產品功能的留存。
圖7:兩種用戶羣體的留存差別
第一個案例:以社區網站爲例,「每週簽到3次」的用戶留存率明顯高於「每週簽到少於3次」的用戶。簽到這一功能在無形中提高了社區的用戶的粘性和留存率,這也是不少社羣或者社區主推這個功能的緣由。
圖8:留存魔法數字
第二個案例:首次註冊微博,微博會向你推薦關注10個大V;首次註冊LinkedIn,LinkedIn會向你推薦5個同事;申請信用卡時,髮卡方會說信用卡消費滿4筆便可抽取【無人機】大獎;不少社交產品規定,每週簽到5次,用戶能夠得到雙重積分或者虛擬貨幣。
在這裏面「關注10個大V」、「關注5個同事」、「消費4筆」、「簽到5次」就是我想說的Magic Number,這些數字都是經過長期的數據分析或者機器學習的方式發現的。實踐證實,符合這些特徵的用戶留存度是最高的;運營人員須要不斷去push,激勵用戶達到這個標準,從而提高留存率。
7.A/B測試與A/A測試
A/B測試是爲了達到一個目標,採起了兩套方案,一組用戶採用A方案,一組用戶採用B方案。經過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞。 在A/B測試方面,谷歌是竭盡全力地嘗試;對於搜索結果的顯示,谷歌會制定多種不一樣的方案(包括文案標題,字體大小,顏色等等),不斷來優化搜索結果中廣告的點擊率。
這裏須要注意的一點,A/B測試以前最好有A/A測試或者相似準備。什麼是A/A測試?A/A測試是評估兩個實驗組是不是處於相同的水平,這樣A/B測試纔有意義。其實這和學校裏面的控制變量法、實驗組與對照組、雙盲試驗本質同樣的。
有了具體的分析方法還不夠,運營要作好數據分析還須要一個清晰的流程。在這裏我從宏觀、中觀和微觀三個層次給你們介紹一下。
1.中國古代樸素的分析哲學
其實數據分析自古有之,中國古代不少名人從事的其實就是數據分析的工做;他們的名稱可能不是數據分析師,更多的是「丞相」、「軍師」、「謀士」,如張良、管仲、蕭何、孫斌、鬼谷子、諸葛亮。
他們經過 「歷史統計」-「經驗總結」-「預測將來」 爲本身的組織創造了極大的價值,這是中國古代樸素的分析哲學的重要內容。
2.精益創業的MVP理念
風靡硅谷的精益創業,它推崇MVP(最簡化可行產品)的理念,經過小步快跑的方式來不斷優化產品、增加用戶。
圖9:構建-衡量-優化
在運營工做中,咱們要大膽嘗試,將想法轉化成產品和運營方法。而後分析其中的數據,衡量產品或者運營的效果。若是好的話保持並大力推廣,若是很差的話總結問題及時改進。在「構建-「衡量」-「學習」的不斷循環中逐漸優化,這個流程是很是適合運營工做的。
《誰說菜鳥不會數據分析》書中介紹了更爲具體的分析流程:1.明確分析目的和思路 →2.數據收集 →3.數據處理 →4.數據分析 →5.數據展示 →6.報告撰寫。
這個流程只是從「數據」的角度闡述了先後的流程,並未結合業務實際;並且它將數據分析的落腳點定位於「報告撰寫」是具備誤導性的,由於數據分析的最終目的是爲了指導實踐,而不是寫一份報告。 可是這個流程仍具備參考價值,尤爲是 「明確分析目的和思路」 對於新手入門具備必定的指導意義。
下面介紹的是一個很是詳細的分析流程,藉助於必定的分析工具,咱們能夠按照這個思路對您的網站/APP進行細緻入微的分析。
圖10:微觀數據分析流程
這是GrowingIO商務分析師檀潤洋在《提升用戶留存,產品、市場和運營都有哪些方法》中介紹的流程,我認爲適用於大部分的運營數據分析。
它的前提是用數據分析工具作好數據採集和監控工做,把精力集中在業務分析上。這個流程的核心是「MVP」的理念,「發現問題」-「設計實驗」-「分析結果」,經過數據來不斷優化產品和運營。
小張今年剛畢業,在某公司從事新媒體工做,負責微信的平常運營。小張並不清楚微信運營的核心目的,嘗試了不少方法,原創、翻譯、改寫了不少文章發佈在微信上,可是閱讀量時高時低,整體通常。
經理讓小張想辦法改進一下微信運營,提升微信的粉絲數和閱讀數;可是張三毫無頭緒,無從下手。這是不少運營真實的寫照,瑣碎的工做容易讓人忘記思考,這極可能就發生在你個人身邊。
咱們從數據分析的角度對這個案例進行了診斷,總結了小張存在的這些問題:
從業務增加的角度出發,我給小張量身定作了一套數據分析體系,配合其內容工做的開展。
第一點,內容定位。
運營須要明確知道本身的目標或者KPI,而後選擇一個核心關鍵指標(OMTM)進行監測。若是是創業公司,初期可能須要拉新,那麼核心指標是註冊用戶數或者新訪問用戶數。若是是資訊媒體,注重影響力和覆蓋面,那麼核心指標應該是微信閱讀數或者網頁PV。
第二點,用戶畫像。
不管是哪種運營崗位,都須要明確知道本身的(目標)用戶是那些人?這些人都有哪些特徵,他們的關注點和痛點是什麼?若是你的用戶是產品經理,那麼能夠嘗試爬蟲抓取產品經理網站上有關的問題,而後作文本分析:這是定量層面的分析。同時,經過調查訪問和問卷調研,獲取更加深刻的用戶特徵信息:這是從定性層面的分析。
第三點,持續監測。
藉助數據分析工具,對核心關鍵指標(OMTM)進行持續監測。對於指標異常狀況,咱們須要及時分析和改進。
第四點,數據分析。
統計和分析過往內容的數據,找出哪些內容、哪些標題、哪些形式、哪些渠道的效果更好,而後朝這方面不斷優化。
電子郵件營銷是如今不少企業仍在採用的營銷和運營方式,某互聯網金融企業經過EDM給新用戶(有郵件地址可是未註冊用戶)發送激活郵件。一直以來註冊轉化率維持在20%-30%之間,8月18日註冊轉化率暴跌,以後一直維持在10%左右。
圖11:EDM渠道註冊轉化率暴跌
這是一個很是嚴重的衰退,須要當即排查緣由。EDM渠道註冊轉化率涉及到太多的因素,須要一個一個排查,數據分析師幫運營羅列了可能的緣由:
一個簡單的業務指標,會影響到它的因素多是多種多樣的,因此咱們須要對可能涉及到的因素進行精細化衡量才能不斷優化。最後發現,產品經理在註冊環節添加了『綁定信用卡』,致使註冊轉化率大幅度降低。
數據分析並無想象中的高不可及,掌握好相應的概念、思路、流程,運營均可以作好數據分析。
這裏要着重強調一點,數據分析的目的是指導業務實踐;脫離實踐的數據分析、爲分析而分析的數據分析都是在耍流氓。
不一樣於職業的數據分析師和數據科學家,運營人員作好數據分析的前提是嫺熟的業務理解。從業務的角度來講,數據不是數字,它是用戶的心聲。運營人員要從數據中發現問題,不斷優化,提高用戶體驗、爲用戶創造更多的價值。
磨刀不誤砍柴工,作好數據分析工具必不可少。我彙總了下面幾種工具,運營能夠結合本身的實際須要採用。
運營入門數據分析,並不須要學習多麼複雜的數學知識理論,更多的是將業務操做和數據分析結合起來。我這裏推薦兩個網站和兩本書,但願有幫助。
做者:官世強,關注內容營銷和數據分析。我的公衆號:內容運營那些事。
Refer:
[1] 運營入門,從0到1搭建數據分析知識體系
[2] 帶你走進網站分析的世界!
[3] 關於數據分析那些事,看這一文章就夠了
[4] 百度內部培訓資料PPT:數據分析的道與術