避坑指南!數據分析最容易被忽略的10個錯誤

本文總結了數據分析的幾個階段中最常犯的10個錯誤,以及規避的方法,收藏起來,分析不翻車!工具

避坑指南!數據分析最容易被忽略的10個錯誤

 

 1、數據採集階段

一、數據失真學習

數據是可能騙人的,好比店鋪、電影的評分,可能被人爲操控;好比某公司發佈的行業分析報告,也具備很大的主觀性。spa

基於錯誤的數據,作出的分析結論是無益甚至是有害的。因此在採集數據時,咱們先要考證數據的來源及可信度,還要關注不符合常理的數據變化,對數據採集方法進行調整。blog

二、倖存者誤差數據分析

就算數據是真實的,也不能輕信。class

舉個有名的例子,二戰時英軍發現,從戰場飛回來的戰機,機身上的彈孔比引擎和油箱上的要多的多,根據這個數據,咱們很容易得出要增強機身的防禦的建議。但事實的真相倒是,那些引擎和油箱上中彈的飛機已經回不來了,咱們更應增強引擎和油箱的防禦,這就是常說的「倖存者誤差」。效率

避坑指南!數據分析最容易被忽略的10個錯誤

 

形成倖存者誤差的緣由,實際上是取樣出現了誤差,在數據採集時,咱們要避免主觀臆斷,推演各種可能性,科學取樣。基礎

2、數據處理階段

一、原始數據沒有備份變量

不少新手在拿到原始數據後,喜歡在原始數據基礎上把異常值剔除,再備份再作數據處理。但時常到後面發現刪除的值其實並不是異常值或者仍然有價值,這時候想找回值就麻煩了。因此,當咱們拿到原始數據後,第一件事就是要作好備份。互聯網

避坑指南!數據分析最容易被忽略的10個錯誤

 

二、不重視數據清洗

拿到數據後,大量繁瑣的數據清洗工做經常讓數據分析師們感到煩惱,不少人會圖省事略過一些步驟,但這經常會形成返工,拖延了項目進度。

乾淨的數據源是咱們一切分析工做的基礎,咱們須要重視數據清洗。固然了,爲了提升數據處理效率,咱們能夠採用專業的數據分析工具。就拿我在用的FineBI來講,極大簡化了數據處理流程,僅需拖拽就能完成數據的清洗、轉化、抽取、合併、計算等功能,咱們不須要花大量時間在數據處理上,能夠把精力聚焦在業務分析上。

避坑指南!數據分析最容易被忽略的10個錯誤

3、數據分析階段

一、過分追求技巧

熟練使用各類數據分析工具如Excel、SQL、FineBI、Python,以及各種經典的分析方法,是每一個數據分析大神的基本功,但這並不意味着,好的數據分析,就必定要用到各類高級的工具和方法。

不少數據分析新人會去搜羅各類最新的分析方法和思路,套用在項目中,以證實本身的工做能力。但真正優秀的數據分析,依靠的是不斷深刻地探索,以及嚴謹的邏輯鏈條。再好的工具和方法,都是爲人服務的,合適的就是最好的。

二、過分依賴套路

咱們不能過分追求技巧,但必要的方法論儲備是要有的。在數據分析行業,並不存在「一招鮮,吃遍天」。

避坑指南!數據分析最容易被忽略的10個錯誤

咱們在剛開始學習數據分析時,會學習各類解題套路,但真正實操時,其實並不存在通用的套路。不一樣的行業、不一樣的業務,不一樣的階段,哪怕用的是同一種分析方法,結論都應有所區別。好比to C和to B行業的客戶運營就是不同的,好比互聯網初創公司可能追求用戶增加,步入成熟期後追求利潤率提升。

這裏並非鼓勵你們盲目追求技術,而是咱們要在平常工做中多學習積累分析思路和方法,豐富本身的武器庫,未來勝任更多的應用場景。

三、相關性≠因果性

在分析時,咱們經常將不一樣指標的數據進行關聯分析,找出問題的緣由。但這樣每每會犯一個錯誤,就是錯把相關當成因果。

避坑指南!數據分析最容易被忽略的10個錯誤

咱們經過統計,發現常吃海蔘的人比不吃海蔘的人智商要高一些,但這背後實際上是由於吃海蔘的人廣泛比較富裕,於是受教育水平高,測出的智商高,咱們不能說爲了提升智商趕忙去吃海蔘。

爲了不這一錯誤,咱們在對數據間的相關性進行邏輯推演時,應時刻帶着批判性思惟,考慮各類中介變量。

四、由結果推緣由

錯誤的數據,披上科學的外衣,是很危險的事。若是咱們在開始分析前,就已經在內心預設了一個結論,帶着結論找緣由,射箭畫靶,那作出的分析可能毫無價值甚至可能帶來極大的損失

數據分析的優點,在於尊重客觀數據而並不是人的主觀臆斷。因此,咱們在進行數據分析前,應摒棄主觀臆想和經驗主義,相信常識和客觀數據,分析時還要屢次檢查邏輯的嚴謹性。

4、分析報告階段

一、誤導性圖表

業內都說字不如表、表不如圖,但比不用圖表更可怕的,是用誤導性圖表。好比下面這兩張圖,光看左邊會明顯感知到數據在飛速增加,而看到右邊才能得知真正的增加速度。

避坑指南!數據分析最容易被忽略的10個錯誤

我認爲,報告仍是應當追求真實,不逃避問題、不美化缺陷,也是分析師的職責所在。

二、結論脫離業務實際

不少人在彙報結論時,只是簡單把數據分析結果說了一通,得出一些模擬兩可或者你們都知道的廢話,並無聯繫到業務實際,也並不具有可行性,這樣的報告參考價值很低。

避坑指南!數據分析最容易被忽略的10個錯誤

業務決策不光是業務人員的事,數據分析人員每每能從客觀的角度提出獨特的看法。我建議你們多和業務人員交流,至少要熟悉各個業務環節,瞭解提出數據分析需求的緣由,最終得出的結論要有針對性,給出具體可落地的實質建議。

分享一下這個分析工具,回個「數據分析」就能拿得!