最近跟公司的數據分析師打交道比較多,其中一個分析師認爲:行業對數據分析師這個崗位的理解有嚴重誤差。前端
由此產生了一個好奇,行業理解數據分析師是什麼?誤差是什麼?嚴重誤差的嚴重在哪裏?面試
講真啊,這麼大的問題,我一個都答不上來。我就根據本身在工做中,親身遇到數據分析師接的任務來講一下我理解的這個崗位吧。數據庫
領導會要求運營人員要多看數,多分析數據,理解數據背後的意義。工具
而後天天都會接到運營提出的相似這種樣子的任務:XX,最近PC的數據降低的厲害,幫忙分析下是什麼緣由吧。XX,昨天App的數據降的多,看看是怎麼回事。XX,上週移動端上發生什麼了?致使咱們的新用戶大幅減小。大數據
好吧。這些就是我平常中的一小部分(平常的東西太多了^-^)。其實我部門的數據分析師乾的就是這些活:爲數據異動找到一個合理的解釋。必須強調:這是我部門的數據分析師。行業的數據分析師是幹嗎的,據我所知,每一個公司還真不同。excel
要給出一個合理的解釋,實際上是挺難的。最難的是提需求方是否能接受分析師給的結論。我部門的好處是:哪怕結論是很是悲觀的,只要合情合理,也能接受。這一點難能難得。內存
一些人是不太能接受悲觀解釋的,好比某公司CEO就不太能接受數據分析師給出這種結論:行業用戶規模已經見頂,咱們發掘新用戶的成本將大幅上升,且增加將減慢。因而CEO甚至會不看分析過程,直接把結論懟回去:你分析的不對,從新來過。由於他不能接受這種結論。開發
若是需求方大老闆是這種個性,那麼數據分析師的任務就變成了:不要分析我提出的觀點對不對,請你負責證實我是對的。哪怕是錯的,也要變着方證實我是對的。數據分析
因此數據分析師這個崗位分兩種:基礎
一、分析事情的緣由,並給出解釋。
二、證實領導的話是對的。
不論是1仍是2,其實作事的方法是同樣的,就是如下步驟循環使用,直到問題被解釋/證實出來。
一、抓重點。
二、往下拆。
我工做中,重點是這麼理解的:用最少的動因組合解釋80%以上的異動狀況。
往下拆是這麼理解的:若是解釋還不能知足需求,就須要把動因再找個維度,往下拆解一層。而後對拆解的內容繼續抓重點,往下拆。
因此面試中我都會問一個問題:針對XXX狀況,請你至少找2個維度來分析這件事。
至於須要掌握的技能嘛,身爲互聯網大數據行業,SQL必需要會。大部分傳統行業來面試的,由於SQL不過關被我斃掉了。由於沒耐心教怎麼寫SQL,仍是要找個來了就直接能寫的才行。工具方面excel確定要會,matlab、spss等,會一、2個就行,沒有什麼特殊要求。計算機語言也得會一個,最好是Python,若是不會Java、C/C++也能夠。相比起來,Python更簡單,更好學。計算機語言是做爲膠水使用的。把數據庫導出的數據預處理一下,輸入到分析軟件中。數據庫和分析軟件之間的膠水。因此不須要掌握的很好,畢竟不是作工程,只是在分析師的工做電腦上作一個數據格式轉換和基礎的清洗而已。代碼寫的有內存泄露、複用性差,這些都不是問題。
此次成功的把一個前端開發培養成了一個數據分析師,也是很欣慰的。堪稱0基礎手把手教會的經典案例。