2018 數據分析師成長指南


文/ 曾加 螞蟻金服數據分析師

導語:從零開始學數據分析,什麼程度能夠找工做?螞蟻金服數據分析專家從三個關鍵問題出發,幫你係統梳理應該如何進入數據分析行業。

     不少人建議新手去點亮不少技能樹,什麼 Excel/統計學/SQL/R/Python/Hadoop/機器學習/可視化 等等,對此我並非很是認同,緣由很簡單:若是目的在於「找工做」,核心在於「快速入行」,而不在於「系統學習」,所以一開始學習這麼多領域的知識是不太合適的。node


接下來,要「逆向思考」,分步解答這個問題。面試


問題一

我想進什麼樣的公司?
在我心目中,數據分析師的平常工做狀態應該是怎樣的?

     這個問題很是重要,甚至比學什麼更重要,由於一樣 title 爲「數據分析師」的職位,工做內容可能截然不同:有的相似於「商業諮詢師」,有的相似於「數據倉庫工程師」,有的相似於「機器學習工程師」,也有的相似於「數據口徑覈對師」等等。算法


     這些一樣名爲「數據分析師」的崗位,不只工做內容徹底不一樣,須要的技能樹也徹底不同。若是不弄清它們各自所需的技能樹,就去「盲人摸象」般地學習各種知識,到頭來找工做時看到崗位需求的時候,極可能會傻眼。編程


舉個例子:在一些大型的互聯網公司(如阿里、騰訊等)裏,有一個崗位叫「商業數據分析師」,聽起來挺高大上的,不過若是我告訴你,作這個崗位的不少人不須要懂統計學,不須要懂 Python,更不須要懂什麼機器學習,只須要會 SQL 而且有「業務sense」就能夠了,你是否是會感到驚訝和疑惑呢?但事實就是如此。框架


必需要說的是,不是全部的「數據分析師」都須要用到高大上的工具,由於大部分數據分析師的核心目標是「解決問題」(而解決問題所用的方法則未必重要),而解決問題的核心每每是「懂業務」,這是不少公司在招聘時強調「業務sense」的重要緣由。若是以爲會不少技能就很厲害,那是典型的「學生思惟」。機器學習


 P.S. 也許你又有一個疑問,對於剛入行的人來講,所謂的「業務sense」如何判斷呢?或者說,面試的時候,面試官如何判斷一個初級的應聘者是否有業務sense?經過個人觀察,對國內互聯網大公司而言,主要是四個方向:

  1. 學校和專業背景(偏數理的理工科或經濟類爲佳)是否有競爭力;
  2. 是否有相關的實習經歷;
  3. 描述本身經歷時和回答問題時的邏輯性和框架性;
  4. 對當前互聯網時事新聞的看法是否有趣而獨到。


問題二

假如我如今已經有心儀的公司了,我該如何判斷這個公司的工做內容,
更進一步地,判斷本身須要掌握哪些技能?

一個簡單的方法是直接去應聘網站看JD(崗位描述),但這個方法並非特別通用。在我看來,不妨從 公司類型、公司規模、公司業務、公司階段、公司風格 這五個維度來判斷「數據分析」崗位所須要的技能。以下圖所示:
工具



1. 公司類型

在不一樣類型的公司裏,數據分析師的工做是徹底不一樣的:oop

  • 對於傳統公司而言,數據分析師更接近於「業務分析師」,他們不須要處理太多的原始數據,更多地須要將已有的數據整合和分析,從而支持業務發展,對於這類公司來講,統計學是重要的,而 Excel/R/Tableau 等處理數據的工具也是有必要學習的。
  • 但對於不少互聯網公司而言,數據分析師可能須要處理更多原始數據,因此SQL/Python/Java 等數據清洗的工具顯得更重要一些。

2. 公司規模

小公司和大公司的「數據分析師」作的事情「廣度」有明顯差異。學習


對於大公司而言,業務分工比較明確「數據分析師」是一系列不一樣的崗位:網站


  1. 離原始數據最近、離業務最遠是 數據倉庫工程師(它有不少別名,如:數據工程師/數據融合工程師/ETL工程師等等),他們的工做主要是把技術從用戶和商戶這裏提取的行爲數據進行清洗和預處理,使其結構化,是更接近於技術的崗位,相對來講,工做會比較單純一些。
  2. 距離原始數據較遠、離業務較近的是 商業數據分析師(又稱:Business Intelligence,BI),他們的工做是提取正確的業務數據,並製做報表和具備洞見的分析。這類崗位可能須要處理不少繁雜的數據口徑、須要會 SQL,根據公司的報表體系須要會 Tableau/Excel,但更重要的是能給業務方有效的輸入。也正由於這個崗位連接了數據和業務,因此須要很是強的「協同能力」。
  3. 距離原始數據和業務都不近不遠的數據崗位主要是 數據挖掘工程師 (也有一些分支,如:算法工程師、機器學習工程師等等),這些崗位每每不須要接觸最原始的數據,也不會在業務的最前線,但一般須要給業務提供一些間接的能力,好比判斷能力(如:兩個用戶的關係是否爲同窗)、預測能力(如:預測會產生業務風險用戶)、識別能力(如:判斷一張圖片是否爲貓)等等。這類工做自己比較獨立,頗有創造性,但要求也比較高。



但對於小而精的公司而言,「數據分析師」的崗位分工可能就不那麼明確了。由於人手有限,公司不能爲每個工做職能制定對應的崗位,因此但願能招一個「全棧數據分析師」(更酷的說法是:「數據科學家」)。從數據提取到展示結果的每個環節,「全棧數據分析師」都須要十分清楚,因此綜合能力比較強的員工才能勝任。


3. 公司業務

公司業務對「數據分析師」崗位的工做內容有不小的影響:

• 在垂直的或者說業務比較集中的公司中,數據的來源以及類型相對比較少,咱們在數據預處理上不須要太多的精力,更注重數據的使用和多維度展示,挖掘有價值的信息,這個崗位是比較有探索性的,更接近於「數據挖掘工程師」。

• 但在業務繁雜的公司裏,「數據分析師」的地位比較微妙。業務繁雜意味着變更比較快,這使得通常意義上的「數據分析師」每每沒法長時間地作相同的業務(一直對接同一業務的分析師咱們通常叫作「行業運營」(不要以爲運營崗位不夠高大上,事實上優秀的運營也很擅長數據分析,對公司的價值很大),因此快速產出數據的能力就變得尤其重要了。此外,在這種狀況下,咱們須要優質的數據體系,更進一步地,須要「數據產品」。像 Tableau 就是很是優秀的數據產品,不少大型的公司也會去設計本身的數據產品,以知足業務的須要。有了作數據產品的需求,咱們就多了兩類新的職位,一個叫「數據開發工程師」,一個叫「數據產品設計師」。


4. 公司階段

公司所處的階段會影響「數據分析」工做的方向:

  • 對於初創公司來講,整個數據體系還沒有創建,關於數據一般是要啥沒啥,在這個時候,你就別期望能使用模型去作什麼高大上的分析了。配合技術去找到正確的數據纔是你的首要任務。這個工做看起來枯燥,但卻異常重要,若是你能作好,很快就會有機會成爲公司最不可或缺的員工之一——畢竟,對於公司全部的數據,你是惟一的出口。
  • 而對於成熟公司來講,底層數據體系已經搭建得很完善了,對於初級員工來講,你根本不須要修改啥。想要的數據,基本只要有耐心,都能搞獲得,但在口徑的尋找上,可能會很是費時費力,清洗數據須要花費你很長的時間。不過,彙總完一大批數據,不就能夠上高大上模型了嗎?算法、機器學習什麼的,均可以用上,你能夠盡情地在數據的海洋中遨遊。


5. 公司風格

最後說說公司風格。和數據分析師相關的公司風格有兩類,一類是「數據驅動」,一類是「業務驅動」。


對於「數據驅動」的公司來講,咱們會先看足夠多的數據,再從數據中找到有意思的點,而後進行分析來決定將來要作什麼業務;對於「業務驅動」的公司來講,咱們先決定要作什麼業務,而後再決定要什麼數據。


這種風格上的差異會使得數據分析師的地位產生巨大差異。在「數據驅動」的公司裏,數據分析師的地位很高,由於公司的 KPI 是由你來決定的。而在「業務驅動」的公司裏,呵呵,若是沒有優秀的領導者帶領,數據分析師一不留神就會淪爲「取數機器」。


一個不太好的消息是,現在在國內,數據驅動的公司少之又少,尤爲在一些大公司裏,雖然它們自稱是「數據驅動」的,但事實上,數據分析師經常被業務牽着鼻子走,位於附屬的地位。因此,在真正工做以前,若是有機會的話,仍是建議先實習,避免遇到坑。


好了,看完了上面內容,你大概就會知道本身究竟想作什麼類型的數據分析師,在學習時也就能夠有的放矢了。


問題三

若是我真的是零基礎,該如何入門呢?

回到開頭的回答,不少答主推薦了一堆書,什麼《深刻淺出數據分析》《深刻淺出SQL》等等,這些書固然不錯,不過據我觀察,看書自學比較適合有天賦的人,大部分人很難有的放矢地只經過看書學好,對於真正的小白來講,經過在線學習平臺是從零學習快速入行的首選方法。預估大約花 300 小時,就能夠有不錯的基礎了。



至於平臺選擇,雖然國內教育平臺正在蓬勃發展,但我仍是更傾向於海外平臺,由於它們起步更早,發展得也更充分一些。


Coursera 是衆所周知的,數據分析的課程也挺多,適合各類不一樣需求的人,開課的講師大多爲北美名校教授,課程對知識的講解會比較到位,但大部分課程是全英文的,對不少英語基礎不太好的小白來講有點小障礙;


優達學城(Udacity) 同爲三大在線平臺,課程的質量也很高,講師大都來自硅谷互聯網巨頭,好比 Facebook 和 Google,課程有完整漢化。學完後在找工做方面比學院派的 Coursera 更有針對性,而實戰項目和其提供的中文助教和導師服務也能協助學習,以數據分析課程爲例,入門就能夠從零掌握 Python/SQL/統計學基礎。


進階課程則進一步涉及到 R/Tableau 等,總共花 300 小時左右認真學完和吸取之後,數據分析的基礎能夠打得很是紮實。而對於上文提到的大互聯網企業中的「商業數據分析師」,也有無需學習任何編程的對應課程,知足這樣的崗位需求。



當即加入7天試學: Udacity 【數據分析師】納米學位

13周入門數據分析,學會用 Tableau、Python 和 R 創造最佳的數據解讀


打好基礎,再針對本身想要去的公司和崗位學一些進階課程。那麼,只要學歷背景不算太差,那麼憑本身精心打造的「技能樹」成長路線,到大部分公司勝任絕大多數數據分析師初級崗位應該是沒有問題的。


固然,不管是學習什麼課程,完整地學一遍下來都不是一件輕鬆的事。但畢竟是職業選擇,慎重一些、認真一些,多花一些精力甚至是金錢,也絕對是值得的。


硅谷大學讓你在業餘時間掌握新技能

Udacity 優達學城的創始人是 Google 無人車之父 Sebastian Thrun,與 Google、Facebook、亞馬遜等全球領先企業聯合打造了一系列前沿技術課程,並提供人工項目審閱、一對一在線答疑等學習服務,旨在讓每一個人都能用遠低於線下教育的成本硅谷最新最熱技術教育,幫助學員成爲能驅動企業創新變革的搶手人才。

相關文章
相關標籤/搜索