文/ 曾加 螞蟻金服數據分析師
不少人建議新手去點亮不少技能樹,什麼 Excel/統計學/SQL/R/Python/Hadoop/機器學習/可視化 等等,對此我並非很是認同,緣由很簡單:若是目的在於「找工做」,核心在於「快速入行」,而不在於「系統學習」,所以一開始學習這麼多領域的知識是不太合適的。node
接下來,要「逆向思考」,分步解答這個問題。面試
我想進什麼樣的公司?
在我心目中,數據分析師的平常工做狀態應該是怎樣的?
這個問題很是重要,甚至比學什麼更重要,由於一樣 title 爲「數據分析師」的職位,工做內容可能截然不同:有的相似於「商業諮詢師」,有的相似於「數據倉庫工程師」,有的相似於「機器學習工程師」,也有的相似於「數據口徑覈對師」等等。算法
這些一樣名爲「數據分析師」的崗位,不只工做內容徹底不一樣,須要的技能樹也徹底不同。若是不弄清它們各自所需的技能樹,就去「盲人摸象」般地學習各種知識,到頭來找工做時看到崗位需求的時候,極可能會傻眼。編程
舉個例子:在一些大型的互聯網公司(如阿里、騰訊等)裏,有一個崗位叫「商業數據分析師」,聽起來挺高大上的,不過若是我告訴你,作這個崗位的不少人不須要懂統計學,不須要懂 Python,更不須要懂什麼機器學習,只須要會 SQL 而且有「業務sense」就能夠了,你是否是會感到驚訝和疑惑呢?但事實就是如此。框架
必需要說的是,不是全部的「數據分析師」都須要用到高大上的工具,由於大部分數據分析師的核心目標是「解決問題」(而解決問題所用的方法則未必重要),而解決問題的核心每每是「懂業務」,這是不少公司在招聘時強調「業務sense」的重要緣由。若是以爲會不少技能就很厲害,那是典型的「學生思惟」。機器學習
P.S. 也許你又有一個疑問,對於剛入行的人來講,所謂的「業務sense」如何判斷呢?或者說,面試的時候,面試官如何判斷一個初級的應聘者是否有業務sense?經過個人觀察,對國內互聯網大公司而言,主要是四個方向:
假如我如今已經有心儀的公司了,我該如何判斷這個公司的工做內容,
更進一步地,判斷本身須要掌握哪些技能?
一個簡單的方法是直接去應聘網站看JD(崗位描述),但這個方法並非特別通用。在我看來,不妨從 公司類型、公司規模、公司業務、公司階段、公司風格 這五個維度來判斷「數據分析」崗位所須要的技能。以下圖所示:
工具
在不一樣類型的公司裏,數據分析師的工做是徹底不一樣的:oop
小公司和大公司的「數據分析師」作的事情「廣度」有明顯差異。學習
對於大公司而言,業務分工比較明確「數據分析師」是一系列不一樣的崗位:網站
但對於小而精的公司而言,「數據分析師」的崗位分工可能就不那麼明確了。由於人手有限,公司不能爲每個工做職能制定對應的崗位,因此但願能招一個「全棧數據分析師」(更酷的說法是:「數據科學家」)。從數據提取到展示結果的每個環節,「全棧數據分析師」都須要十分清楚,因此綜合能力比較強的員工才能勝任。
公司業務對「數據分析師」崗位的工做內容有不小的影響:
• 在垂直的或者說業務比較集中的公司中,數據的來源以及類型相對比較少,咱們在數據預處理上不須要太多的精力,更注重數據的使用和多維度展示,挖掘有價值的信息,這個崗位是比較有探索性的,更接近於「數據挖掘工程師」。
• 但在業務繁雜的公司裏,「數據分析師」的地位比較微妙。業務繁雜意味着變更比較快,這使得通常意義上的「數據分析師」每每沒法長時間地作相同的業務(一直對接同一業務的分析師咱們通常叫作「行業運營」(不要以爲運營崗位不夠高大上,事實上優秀的運營也很擅長數據分析,對公司的價值很大),因此快速產出數據的能力就變得尤其重要了。此外,在這種狀況下,咱們須要優質的數據體系,更進一步地,須要「數據產品」。像 Tableau 就是很是優秀的數據產品,不少大型的公司也會去設計本身的數據產品,以知足業務的須要。有了作數據產品的需求,咱們就多了兩類新的職位,一個叫「數據開發工程師」,一個叫「數據產品設計師」。
公司所處的階段會影響「數據分析」工做的方向:
最後說說公司風格。和數據分析師相關的公司風格有兩類,一類是「數據驅動」,一類是「業務驅動」。
對於「數據驅動」的公司來講,咱們會先看足夠多的數據,再從數據中找到有意思的點,而後進行分析來決定將來要作什麼業務;對於「業務驅動」的公司來講,咱們先決定要作什麼業務,而後再決定要什麼數據。
這種風格上的差異會使得數據分析師的地位產生巨大差異。在「數據驅動」的公司裏,數據分析師的地位很高,由於公司的 KPI 是由你來決定的。而在「業務驅動」的公司裏,呵呵,若是沒有優秀的領導者帶領,數據分析師一不留神就會淪爲「取數機器」。
一個不太好的消息是,現在在國內,數據驅動的公司少之又少,尤爲在一些大公司裏,雖然它們自稱是「數據驅動」的,但事實上,數據分析師經常被業務牽着鼻子走,位於附屬的地位。因此,在真正工做以前,若是有機會的話,仍是建議先實習,避免遇到坑。
好了,看完了上面內容,你大概就會知道本身究竟想作什麼類型的數據分析師,在學習時也就能夠有的放矢了。
若是我真的是零基礎,該如何入門呢?
回到開頭的回答,不少答主推薦了一堆書,什麼《深刻淺出數據分析》《深刻淺出SQL》等等,這些書固然不錯,不過據我觀察,看書自學比較適合有天賦的人,大部分人很難有的放矢地只經過看書學好,對於真正的小白來講,經過在線學習平臺是從零學習快速入行的首選方法。預估大約花 300 小時,就能夠有不錯的基礎了。
至於平臺選擇,雖然國內教育平臺正在蓬勃發展,但我仍是更傾向於海外平臺,由於它們起步更早,發展得也更充分一些。
Coursera 是衆所周知的,數據分析的課程也挺多,適合各類不一樣需求的人,開課的講師大多爲北美名校教授,課程對知識的講解會比較到位,但大部分課程是全英文的,對不少英語基礎不太好的小白來講有點小障礙;
優達學城(Udacity) 同爲三大在線平臺,課程的質量也很高,講師大都來自硅谷互聯網巨頭,好比 Facebook 和 Google,課程有完整漢化。學完後在找工做方面比學院派的 Coursera 更有針對性,而實戰項目和其提供的中文助教和導師服務也能協助學習,以「數據分析課程」爲例,入門就能夠從零掌握 Python/SQL/統計學基礎。
進階課程則進一步涉及到 R/Tableau 等,總共花 300 小時左右認真學完和吸取之後,數據分析的基礎能夠打得很是紮實。而對於上文提到的大互聯網企業中的「商業數據分析師」,也有無需學習任何編程的對應課程,知足這樣的崗位需求。
13周入門數據分析,學會用 Tableau、Python 和 R 創造最佳的數據解讀
打好基礎,再針對本身想要去的公司和崗位學一些進階課程。那麼,只要學歷背景不算太差,那麼憑本身精心打造的「技能樹」成長路線,到大部分公司勝任絕大多數數據分析師初級崗位應該是沒有問題的。
固然,不管是學習什麼課程,完整地學一遍下來都不是一件輕鬆的事。但畢竟是職業選擇,慎重一些、認真一些,多花一些精力甚至是金錢,也絕對是值得的。
Udacity 優達學城的創始人是 Google 無人車之父 Sebastian Thrun,與 Google、Facebook、亞馬遜等全球領先企業聯合打造了一系列前沿技術課程,並提供人工項目審閱、一對一在線答疑等學習服務,旨在讓每一個人都能用遠低於線下教育的成本硅谷最新最熱技術教育,幫助學員成爲能驅動企業創新變革的搶手人才。