瞭解數據產品經理

1、什麼是數據

互聯網天天都會產生大量的數據,互聯網裏的數據就是指咱們在使用互聯網產品時發生的行爲所沉澱下來的結果。例如,咱們在電商網站上瀏覽商品進行購物時會產生商品瀏覽記錄的數據,當咱們完成商品購買時會產生購買記錄數據。咱們在使用微信進行溝通和發佈朋友圈時也會產生大量的數據,這些數據會被記錄下來而且存儲在數據庫中。這些數據能夠被用來進行分析,例如根據用戶瀏覽商品的記錄數據動態的給用戶推薦相關的產品,還可使用大量的數據分析和預測用戶行爲,這個過程咱們稱之爲大數據。大數據的基礎是數據自己,也就是說,必須先積累足夠大的數據樣本,而後基於這些樣本進行具體的分析,從而產生有價值的數據分析結果。數據庫

近年來發展迅猛的出行類產品滴滴出行,從出租車發展到專車和快車,在解決人們高效出行的同時,也在調控者整個城市的交通網絡。每一位乘客打車的訂單數據都反映了乘客的出行軌跡,經過某一地區的訂單密度數據能夠反映這個地方的用車需求。滴滴能夠利用這些數據進行平臺上司機運力的調控。爲此,滴滴向司機端推出了運力熱點圖,經過顏色區分不一樣區域的用車需求量的大小,需求量大的地方,在運力熱點圖上顯示的顏色就越深,司機經過運力熱點圖選擇前往用車需求量大的地方就能夠更快的接到用車訂單,從而增長本身的收入。微信

數據是互聯網時代最重要的資產,尤爲是對於互聯網公司。阿里巴巴擁有大量中小商家的數據和數以億計的商品數據,能夠用這些數據產生巨大的價值。若是沒有這些數據,就只是一個系統數據。騰訊具有大量的用戶關係數據,這種用戶關係數據在線上構建了一個社交生態系統,使得微信這樣的產品能在極短期內呈現爆發的姿式,實際上這就是用戶社交關係數據產生出的價值。利用社交關係數據能夠產生不少衍生場景和價值,例如基於微信羣關係的微信紅包,利用社交關係產生的微信運動比拼等。網絡

用戶經過使用產品天天都會產生大量的數據,若是是內容型產品,產生的就是內容數據,例如文字、視頻或者音頻。若是是交易平臺型產品,產生的就是用戶行爲數據和交易數據。根據不一樣的數據類型,能夠進行大樣本的數據分析,數據分析結果能夠轉化爲商業決策的依據,從而反向產生更大的商業價值。能夠說,在互聯網時代,數據是惟一也是最重要的資產。數據結構

2、數據分類及數據分析

咱們天天使用互聯網產品會產生大量的數據,這些數據記錄了咱們在互聯網上經過產品發生的一切行爲,這些大樣本的數據自己也會反映出一些規律,經過對這些海量數據的分析,咱們能夠得出不少結論,經過這些結論能夠指導商業決策和產品設計的調整。大體來講,在互聯網上產生的數據主要分結構化數據和非結構化數據兩類。簡單的說,結構化數據就是按照固定的格式和結構存儲的數據,比如咱們按照格子一個個存放數據;非結構化數據是對一些零散型數據的集中管理,比如咱們在一個格子裏放上不少的零散的東西。測試

這兩種數據分類基本囊括了互聯網上產生的全部數據,針對這兩種數據的分析也均可以挖掘出對應的價值。例如,經過分析結構化數據咱們能夠預測數據走勢,提早預判風險,經過分析非結構化數據能夠進行一些行爲分析和相關推薦。接下來,咱們就分別瞭解結構化數據和非結構化數據,以及數據分析的具體內容。大數據

2.1結構化數據

結構化數據是按照必定的數據規則存儲的數據。例如,電商產品裏的結構化商品數據,這些商品數據按照嚴格的商品分類和商品屬性進行分類存儲,好比手機歸屬在電子產品分類下,每一個手機又具有顏色和內存規格等基本參數。按照這種結構存儲的數據能夠被有效地進行分類管理,基於這種結構化的存儲形式,咱們能夠按照某一維度對數據進行分析和處理。例如,若是咱們要查看,某一款手機的不一樣顏色款式的銷售排名狀況,那麼咱們就能夠先按手機型號緯度進行檢索,把這款手機的所有銷售數據查詢出來,而後在這個數據集合裏再按照顏色款式進行分類查詢,這個時候就能夠獲得這款手機的不一樣顏色款式的銷售排名狀況,基於這種數據分析結果,咱們能夠在下次進貨的時候,有意的提升高銷售的顏色款式數據,下降低銷售的顏色款式數量,這樣就能更好的優化庫存,提高銷量。優化

結構化數據存儲就比如一個標準的大型圖書館,這個圖書館裏的圖書就是數據,每一本書是按照固定編號和分類進行存放和管理的。咱們要調取哪一本書,只須要按照固定編號進行查詢檢索,並且咱們能夠對圖書館的數據進行不一樣緯度的數據檢索分析,例如按照出版年份、出版社、書目類型等。結構化能大大提升數據存儲的規範性和分析能力,咱們平時所說的大數據其實很大一部分都是結構化數據,互聯網中存儲了大量的結構化數據,將現實世界的知識、內容、業務都沉澱在了數據庫中。網站

產品經理接觸比較多的都是結構化數據,例如咱們在設計產品時定義的數據結構都是結構化數據,這些結構化數據組合在一塊兒構成了產品總體。須要注意的是,若是後期須要對產品中的數據進行總體分析,那麼在設計階段就須要根據業務特色對數據結構的定義進行明確分類。舉個例子,在醫療產品裏面,不少檢查報告都是一拍照傳圖的方式進行數據存儲的,這些檢查報告裏有大量的關鍵數據能夠做爲後期患者病歷大數據分析的原始素材,可是若是這些數據是以圖片的方式存儲的,那麼就很難對裏面的關鍵數據進行提取和分析,因此比較好的作法是抽取這些關鍵數據以結構化的方式進行設計,讓用戶進行關鍵數據的填寫硬以圖片爲附件。這樣作雖然在操做上多了一步,可是數據的價值在後期會被髮揮出來,這也是結構化數據帶來的好處。spa

另外,如今有不少的掃描軟件和一些雲筆記軟件都可以將圖片中的文字提取出來,或者直接在圖片中進行文字搜索。還有結構話數據也有弊端,數據結構化的細膩程度取決於人類當前的認知層次設計

2.2非結構化數據

非結構化數據大多數都是一些零散的、沒有必定規律的數據。例如用戶在電商網站上瀏覽商品的瀏覽記錄數據,或者一些系統的操做日誌等,這些不是按照必定的規則進行結構化存儲的數據都叫作非結構化數據。例如圖片、視頻、音頻等數據都是屬於非結構化數據。與結構化數據相比,非結構化數據的採集和分析也要更復雜一些,非結構化數據的數據量同時也要大不少。

例如,結構化的商品數據通常都是按照商品的種類和類型分類的,這些數據的數據基本等同於商品的數據,可是用戶對商品的瀏覽數據倒是很是龐大的,能夠設想一下,一位用戶在商品網站上瀏覽商品,瀏覽的順序是很是多樣化的,並且在不一樣的商品中瀏覽查看的內容也是很是不固定的,由此就會產生大量的瀏覽數據,這些數據都是以非結構化的方式進行存儲的。

非結構化存儲與結構化存儲的區別在於對數據結構的設計。結構化存儲相似於圖書館對書目的標準化分類管理,非結構化存儲就比如一個雜貨倉庫,裏面的貨物隨機擺放沒有必定的規則。可是若是能利用好這些「雜貨」,也能夠從裏面挖掘出「金子」。當咱們分析用戶瀏覽商品的記錄數據時,能夠分析出用戶行爲,例如某個用戶的瀏覽記錄一般都是覆蓋在經濟管理類圖書和鞋類商品上的,經過對這些瀏覽數據的分析,經濟管理類的數據個鞋類的商品,以此提升用戶對產品內容的關注度和成交量。這就是非結構化數據能帶來的實際好處,能基於大量的數據進行決策分析。

另外,須要注意的是,結構化數據是非結構化數據的結構化管理角度上的升級,結構化數據和非結構化數據是能夠轉化的。

3、數據指標

數據指標是指產品在各個方面所記錄和統計出來的數據結果,是對過去進行回顧和對將來進行預測的參考標準。一個公司的業績或者產品的健康程度也能夠經過數據指標反映。常見的數據指標例如活躍用戶數、周活躍用戶數或者月活躍用戶數能夠反映出在一個時間週期內用戶對產品的使用狀況,活躍度越高說明產品被用戶使用得越多轉化率指標是反映一個產品功能的實際效果的數據指標,例如設計並開發了一個產品功能,經過一些指標的監測,能夠反映出這項功能在提升產品用戶活躍度或音促進業務發展時是否真正起到了做用。數據指標是公司業務和產品健康狀況的監測表,基於這些數據指標進行分析,能夠得出不少指導性的建議和下一步的調整萬案。

接下來,介紹一些經常使用的數據指標,在理解它們的時候主要須要注意的是指標名稱、指標的定義、指標的統計方法、指標的意義、指標的應用。

3.1 UV

指標名稱、指標的定義--

UV(Unique Visitor)是網站獨立訪問和獨立用戶的意思,指訪問某個網站的獨立IP的數量,一般計算的週期是當天的0點到24點。UV能夠反映出用戶活躍度,也能夠反映出在某一個固定週期內用戶使用產品的狀況。

 

指標的統計方法--

理論上,UV統計的是獨立IP在一個週期內的訪問,一臺計算機的當前IP地址一般都是固定的,互聯網中每一個接入網絡的設備都有一個惟一的IP地址,能夠經過惟一的IP地址統計訪問站點的訪問數量。

 

指標的意義--

經過UV統計,能夠得出產品的活躍用戶數。經過這個指標能夠判斷在某一個固定週期內,產品的獨立訪問用戶數,UV指標能夠用來分析產品的活躍狀況。

 

指標的應用--

例如產品在作運營活動的時候,能夠監測從運營活動開始到活動結束的時間段內產品的UV數,以此做爲活動效果的反饋指標,若是UV數高,則說明本次運營活動帶來了一些流量,讓用戶更多地使用到了產品,UV數是反映產品健康指數的一個數據指標之一。

 3.2 PV

指標名稱、指標的定義--

PV(Page View)一般是指頁面訪問量,和UV不一樣的是,PV統計的是用戶打開網頁的次數。

 

指標的統計方法--

同一個IP屢次打開也算入其中

 

指標的意義--

PV指標能反映產品中某個頁面的訪問頻率。

 

指標的應用--

好比咱們作一個圖片展現入口有兩個方案時,若是不肯定哪一個方案更好,就能夠把兩個方案都放上,而後經過統計目的頁的PV數進行判斷,PV數高的說明用戶喜歡這個方案而且願意點擊進去。

3.3 DAU/MAU

指標名稱、指標的定義、指標的統計方法--

DAU(Daily Active User)指平常活躍用戶,記錄一天內獨立用戶登陸或者使用產品的次數。

MAU(Monthly Action User)指月活躍用戶,記錄一個月內獨立用戶登陸或者使用產品的次數。

 

指標的意義、指標的應用--

MAU相比DAU是一個更宏觀的指標,DAU是偏向於微觀的指標。經過日活躍用戶和月活躍用戶數據指標的統計觀察,能夠反映出網站或者APP的總體運營狀況,對於運營策略的制定和調整有直接的數據指導做用。好比周六週天的日活躍大的話,產品的運營活動最好放在週六日進行。

 3.4 GMV

指標名稱、指標的定義--

GMV(Gross Merchandise Volume)全稱爲商品交易總額,是一種反映平臺交易總量的數據指標。

 

指標的統計方法--

GMV不是指成交總額,而是指發生的商品交易總額,例如用戶在淘寶上下訂單了可是尚未支付,那麼這個商品的的交易額度也會被計算進入GWV,下單後用戶能夠經過支付寶支付也能夠經過銀聯或者其餘方式支付。

 

指標的意義--

 GMV反映了一個交易平臺的交易活躍狀況,商品在平臺上的流轉是經過用戶的購買行爲觸發的。用戶下訂單越多,平臺的GWV就越高,平臺的交易總額越高。只要是交易類平臺都會涉及到GWV,但GWV也不能反映所有,GWV是商品的交易總額,並非成交總額。

 

指標的應用--

GWV數據指標只能從一個側面反映平臺的交易活躍度,對於交易類平臺關鍵仍是看總成交量。

3.5 轉化率

指標名稱、指標的定義--

轉化率是統計一個大範圍的運營活動或者產品動做轉化出有效用戶的比例。 

 

指標的統計方法--

首先肯定轉化成功的標準的明確的,好比經過地推方式,目的是引導用戶關注公衆號並完成新用戶註冊操做。只要這個操做完成就能夠明確認定轉化成功。注意與留存率相區別。

 

指標的意義--

轉化率越高說明活動的效果越好,投入產出比越高。經過產品引導性的設計和展現也能夠提升轉化率,尤爲是在電商類的產品中,經過設計用戶購物路徑,引導用戶進入某一類商品中去查看,就能提升用戶購買該商品的轉化率。轉化率一般用來衡量投入產出比,低投入、高轉化是全部產品和運營追求的目標。 

 

指標的應用--

好比,咱們在線上作一場運營活動,讓用戶報名參加,有1000個用戶打開並查看了該運營活動,最終有100個用戶成功報名並參加了活動,那麼這次運營活動的轉化率就是10%。

 3.3 留存率

指標名稱、指標的定義--

留存率是指用戶進入產品後,在必定的週期事後留存在產品中的用戶數量。

 

指標的統計方法--

例如,以某一天開始計算,當天加入產品的新用戶是100人,一天後這一批人裏面有50人繼續使用產品,那這一天產品的留存率就是50%,以此類推。

用來統計留存率的經常使用表格以下:

首次使用時間 新增用戶 留存率        
    1天后 2天后 3天后 4天后 5天后
2018-10-23 22 18.2% 22.7% 9.1% 13.6% 18.2%
2018-10-24 8 25% 12.5% 37.5% 25%  
2018-10-25 3 0% 66.7% 0%    
2018-10-26 1 0% 0%      
2018-10-27 5 20%        

 

指標的意義--

留存率能體現產品在用戶心目中的可用性,像微信就是一個活躍度和留存率都很是高的產品,由於用戶天天都經過微信溝通和社交,因此這款產品對於用戶的可用性很是高,用戶留存率天然就高。

 

指標的應用--

 從連續5天的產品用戶留存狀況數據來看,該產品的用戶留存率均值在20%左右,也就是說,10個用戶中只會有兩個用戶繼續使用產品,這說明產品自己對於用戶的吸引力不夠,須要想辦法經過改進產品功能,以此發掘用戶需求來提升產品對用戶的可用性。

 4、數據倉庫

數據倉庫(Data Warehouse)能夠簡寫爲DW,是一種對歷史數據進行存儲和分析的數據系統,一般是爲企業根據過往數據進行分析從而制定相關決策而存在。

爲了理解數據倉庫的存在,首先須要明白的是這裏指的數據倉庫不是平時咱們開發中所說的數據庫。

數據倉庫的數據來源一般是歷史業務數據,例如歷史訂單及客戶信息等,還包括一些系統的操做日誌記錄等。這些數據統一彙總存儲在企業數據倉庫,經過對數據倉庫裏的綜合數據進行有目的的計算和分析,能夠得出業務分析報告和歷史數據報表等。

數據倉庫不一樣於數據庫,數據庫是對實時數據進行存儲和事務性處理的系統,對應的操做包括了增刪查改,可是在數據倉庫中通查只提供查詢操做

數據庫是爲了捕獲數據而設計的,數據倉庫是爲了分析數據而設計的。二者在數據庫的設計上是有區別的,尤爲不要理解爲數據倉庫只是數據庫的數據備份。一般在數據倉庫中,存儲的數據結構要比在業務數據庫裏冗餘一些。另外就像上面介紹的,數據倉庫的數據來源是數據庫和操做日誌數據,通常都是按期的將這些業務數據導入到數據倉庫中,所以數據倉庫中的數據是存在必定的延遲性質的。

若是公司的產品須要進行數據分析等操做時,須要的是數據倉庫的查詢權限,而不是業務數據庫的訪問權限。

5、數據可視化

數據可視化是指經過不一樣的視覺呈現方式,將數字數據經過生動形象的方式呈現出來,使得數據查看者可以以一種更加直觀方便的方式查看數據。數據可視化是對數據分析結果的展現,經過數據可視化能給決策者提供更賤直觀生動的數據決策支持。

數據可視化的技術沒有什麼創新的地方,實際上就是使用現用的網頁技術對數據進行可視化呈現,呈現的方式能夠根據須要進行很是多樣化的選擇,例如曲線圖、餅狀圖、柱狀圖等,除了靜態的展現方式,還能夠對數據進行動態展現,比圖人口遷移路線動態圖。

6、數據驅動下的產品與業務

數據是最能反映產品和業務結果的指標,產品上線之後每每能收集到不少數據,經過這些數據進行進一步分析和驗證,能夠得出一些驗證結論,基於這些結論反向指導產品的優化和業務的調整,能夠不斷的優化產品和業務,利用數據驅動產品和業務也是目前不少公司經常使用的方式。

數據驅動產品和業務的調整的前提是數據的採集,數據採集的方法有不少,如今也有不少第三方公司提供數據採集和分析的服務,例如百度指數或者專門針對移動端產品的統計分析服務的友盟,經過在產品中集成這些第三方平臺的服務,能夠對數據進行有針對性的收集,也能夠本身定義須要收集和統計分析哪些數據。

在移動互聯網時代,移動端成爲主要客戶端產品,能夠統計用戶的活躍地區、手機型號、網絡條件等,能夠基於這些數據統計指標進一步調整產品開發和業務運營策略。例如,根據活躍地區的排名能夠重點對該地區增強業務運營,提升產品業務轉化率;對於手機型號數據,能夠增強對高頻率機型的測試,下降產品故障率。相似的數據指標還有不少,經過這些數據指標驅動產品和業務的優化,是一種指向性更精準、投入產出比更高的作法。在大數據時代,數據是真正有價值的資產,掌握了數據就掌握了將來,數據所能產生的價值遠遠超出咱們的預期,對如今的不少產品和公司來講,掌握數據入口並擁有采集數據的能力就擁有話語權,真正利用數據驅動產品和業務也能在將來產生極大的商業價值。

 

聲明:上面的內容大多數摘抄於《產品經理必懂的技術那點事兒》書中的部分章節。好的知識,共享共用,但願本身的努力能爲國家的富強做出一些貢獻。 

相關文章
相關標籤/搜索