數據分析必須想清楚的兩個概念:指標和維度(轉)

指標與維度是數據分析中最經常使用到的術語,它們是很是基礎的,可是又很重要,常常有朋友沒有搞清楚它們之間的關係,只有掌握理解了,咱們的數據分析工做開展就就容易多了。如今就來講說指標與維度的那些事。ide


一、指標工具

指標,用於衡量事物發展程度的單位或方法,它還有個IT上經常使用的名字,也就是度量。例如:人口數、GDP、收入、用戶數、利潤率、留存率、覆蓋率等。不少公司都有本身的KPI指標體系,就是經過幾個關鍵指標來衡量公司業務運營狀況的好壞。性能

指標須要通過加和、平均等彙總計算方式獲得,而且是須要在必定的前提條件進行彙總計算,如時間、地點、範圍,也就是咱們常說的統計口徑與範圍。大數據

指標能夠分爲絕對數指標和相對數指標,絕對數指標反映的是規模大小的指標,如人口數、GDP、收入、用戶數,而相對數指標主要用來反映質量好壞的指標,如利潤率、留存率、覆蓋率等。咱們分析一個事物發展程度就能夠從數量跟質量兩個角度入手分析,以全面衡量事物發展程度。設計

剛纔說過,指標用於衡量事物發展程度,那這個程度是好仍是壞,這就須要經過不一樣維度來對比,才能知道是好仍是壞。日誌


二、維度blog

維度:是事物或現象的某種特徵,如性別、地區、時間等都是維度。其中時間是一種經常使用、特殊的維度,經過時間先後的對比,就能夠知道事物的發展是好了仍是壞了,如用戶數環比上月增加10%、同比去年同期增加20%,這就是時間上的對比,也稱爲縱比;排序

另外一個比較就是橫比,如不一樣國家人口數、GDP的比較,不一樣省份收入、用戶數的比較、不一樣公司、不一樣部門之間的比較,這些都是同級單位之間的比較,簡稱橫比;ip

維度能夠分爲定性維度跟定量維度,也就是根據數據類型來劃分,數據類型爲字符型(文本型)數據,就是定性維度,如地區、性別都是定性維度;數據類型 爲數值型數據的,就爲定量維度,如收入、年齡、消費等,通常咱們對定量維度須要作數值分組處理,也就是數值型數據離散化,這樣作的目的是爲了使規律更加明 顯,由於分組越細,規律就越不明顯,最後細到成最原始的流水數據,那就無規律可循。get

最後強調一點,只有經過事物發展的數量、質量兩大方面,從橫比、縱比角度進行全方位的比較,咱們纔可以全面的瞭解事物發展的好壞。

clip_image001

進一步拓展思考,我理解爲指標拆分和維度對比。

其實在實際產品數據分析的過程當中也可參照以上思想。

經過大量的數據分析軟件工具應用能夠發現,主要包括如下內容:

· 總體狀況的分析和彙總:全局數據的概況、變化趨勢、佔比等

· 多個維度的分析:若是是日誌數據,已經存在多個數據項,以某一個數據項做爲主關鍵詞彙總分析,同比、環比變化,佔總數的變化。若是沒有日誌數據,則須要想清楚解決這個問題緣由是什麼?須要採集哪些數據項?

· 重要場景問題的分析:根據分析的重要問題、用戶關心的問題進行分析

· 軟硬件性能管理、告警管理、報表管理、基礎參數配置和用戶管理等等


在多維度分析、告警、報表,數據圖表可視化設計呈現方面也存在許多共性,總結以下:

1. 數據的呈現方式是表格仍是圖表?如果時間範圍,時間統計粒度是多少?

2. 表格須要呈現哪些數據?數據的單位?保留幾位小數?數據計算的方法?排序依據?

3. 圖表採用哪種?呈現的範圍是多少?

4. 常見的數據項操做:新增、刪除、修改、查詢

· 新增哪些是必填數據項?校驗重複性和有效性?

· 刪除是否須要提醒?是否具備權限刪除?

· 修改可修改的數據項有哪些?修改後是否要進行校驗有效性和重複項?是否有修改的權限?

· 查詢是精準查詢仍是模糊查詢?是單一查詢仍是支持批量查詢?批量查詢輸入方式的講究?查詢的內容輸入什麼是否支持大小寫 空格等?數據區間的查詢是自定義仍是給出範圍劃分?


人們總認爲與大數據分析沾點邊的技術都要花大價錢才能獲得。但事實上,大數據分析的思想纔是最貴的,技術能夠實現數據批量清洗,處理,呈現地更快、更美。但殊不知道要哪些數據算有效,哪些數據纔是重點須要分析得出有價值的信息。

別用戰術上的勤奮,掩飾戰略上的懶惰

相關文章
相關標籤/搜索