第一章
1定義:數據分析是爲了提取有用信息和造成結論而對數據加以詳細研究和歸納總結的過程。
2目的:把隱藏在一大批看似雜亂無章的數據背後的信息集中和提煉出來,總結出所研究對象的內在規律。
3分類:數據分析可劃分爲描述性數據分析,探索性數據分析和驗證性數據分析。描述性分析是平常工做中主要的數據分析,有對比分析法、平均分析法、交叉分析法。而探索性數據分析以及驗證性數據分析屬於高級數據分析,常見的方法有相關分析、因子分析、迴歸分析。
4數據分析的做用:現狀分析、緣由分析、預測分析
5數據分析操做分6步:
一、明確分析目的和思路
分析思路:
- 營銷方面的理論模型有4P、用戶使用行爲、STP理論、SWOT等;
- 管理方面的理論模型有PEST、5W2H、時間管理、生命週期、邏輯樹、金字塔、SMART原則等
二、數據收集:數據庫、公開出版物、互聯網、市場調查
三、數據處理:數據清洗、數據轉化、數據提取、數據計算等處理方法
四、數據分析
五、數據展示
六、報告攥寫
6數據分析師的職業要求:懂業務、懂管理、懂分析、懂工具、懂設計(五懂)
7幾個經常使用指標和術語
1平均數:表明整體的通常水平,掩蓋了整體內各單位的差別
2絕對數與相對數
- 絕對數:反映總規律
- 相對數:反映現象之間數量聯繫程度的程度
三、百分比和百分點
- 百分比
- 百分點:不一樣時期以百分數的形式表示的相對指標的變更幅度
四、頻數與頻率
- 頻數:一組數據中個別數據重複出現的次數(絕對數)
- 頻率:每組類別次數與總次數的比值,表明某類別佔整體出現的頻繁程度。
五、比例與比率
- 比例:整體中各部分的數值佔所有數值的比重,反映整體的個構成和結構
- 比率:不一樣類別數值的對比,反映總體中各部分之間的關係
六、倍數與番數
- 倍數:C=A/B一個數除以另外一個數的商,表示數量的增加或者上升幅度
- 番數:原來雨量的2n次倍
七、同比與環比
- 同比:歷史同時期進行比較,反映事物發展的相對狀況。相差是週期
- 環比:指一個統計期進行比較,反映事物逐期發展的狀況。相差是1
小結:
分析時注意:
一、先整體後局部
二、結構爲王!
第五章 數據分析
一、數據分析方法論與數據分析
二、數據分析方法
一、對比分析方法:將2個或者2個以上的數據進行比較,分析差別,從而揭示數據所表明的事情發展狀況和規律(靜態對比和動態對比)
二、分組分析方法:不只都整體數量特徵和數量關係進行分析,還要深刻整體內部進行分組分析。
一、肯定組數
二、肯定組距
三、結構分析方法:整體內佔各部分整體的比例
四、平均分析方法:平均數反映整體在必定時間條件下某一數量特徵的通常水平
一、能夠對比顯示差別程度,比用總量指標更具說服力
二、對比不一樣時期,說明發展趨勢和規律
五、交叉分析法:分析兩個變量之間的關係,將兩個有必定聯繫的變量及其值排列成一張2維表,使各變量值成爲不一樣變量的交叉結點
六、綜合評價分析法:將多個指標轉化爲一個可以反映綜合狀況的指標進行評價(計算加權的方法:專家訪談法、德爾菲法、層次分析法、主成分分析法、因子分析法、迴歸分析法,
目標優化矩陣表
)
七、杜邦分析法:分析A公司市場佔有率降低緣由
八、漏斗圖分析法:業務流程
- 結合對比分析法、分組分析比較同一環節優化先後、不一樣用戶羣、同行相似的轉化率
九、矩陣關聯分析法(象限圖分析法):根據事物的兩個重要指標,關聯分析,分爲重要不重要等優先級幫助決策。
一、研究發展狀況:時間
二、改進難易程度的指標(氣泡圖)
2.1利潤(絕對數值)
10高級數據分析方法
11數據分析工具
數據透視表:就是列聯表,多列關係展現和查詢
分析工具庫
一、基本統計分析
二、直方圖:柏拉圖(帕累託圖:將直方圖按頻數大小排序
)
三、抽樣:
間隔抽取,固定間隔提取數據(這個也叫作抽樣!resample。。。)
相關關係:2者,一個會影響另外一個的變化(
變化可使隨機的!,由於還有其它影響因素存在)
迴歸函數係數:2者依存關係,相互對應。能夠作預測
直線相關:用
相關係數指示
曲線相關:用
相關指數
指示
多重相關:用
複相關係數
指示
多重線性迴歸:
多個自變量和一個因變量
多元線性迴歸:
一個自變量和多個因變量
(好比多個自變量之間有相互依賴關係)
六、時間序列
移動平均:消除季節或偶然因素干擾而產生的隨機變更影響
指數平滑
趨勢外推
季節變更
趨勢外推法的補充:
一、利用差分法把非平穩序列修勻!
二、