從入門到求職,成爲數據科學家的終極指南

做者 | Admond Lee
翻譯 | Mika
本文爲 CDA 數據分析師原創做品,轉載需受權html

你想成爲一名數據科學家?很棒,說明你是頗有上進心的人,並且對數據科學充滿熱情,並但願經過解決複雜的問題爲公司帶來價值。可是你在數據科學方面毫無經驗,也不知道如何開始。我很懂你,由於曾經我也是如此。本文就是特別針對熱情且有抱負的數據科學家,解答進入該領域最多見的問題和挑戰。面試

我但願經過分享我本身的經驗,幫助你瞭解入科從事數據科學的職業,併爲你提供一些指南,讓你的學習之旅更加愉快。讓咱們開始吧!算法

數據科學人才缺口編程

根據國際數據公司(IDC)預測,2020年全球大數據和業務分析收入將超過2100億美圓。機器學習

根據LinkedIn 與2018年8月發佈的美國勞動力報告, 2015年美國的數據科學人才過剩。三年後,隨着愈來愈多公司面臨數據科學技能人才的短缺,這一趨勢發生了巨大變化。愈來愈多的公司開始使用大數據得出分析看法和制定決策。ide

從經濟角度講,這徹底取決於供需關係。工具

好消息是:形勢以及發生了轉變。壞消息是:隨着數據科學領域的就業機會不斷增長,但不少有抱負的數據科學家因爲技能不符合市場的需求,而難以找到心儀的工做。oop

在接下來的部分中,你將看到該如何提升數據科學技能,從而在大量求職者中脫穎而出,最終收穫夢想的工做。學習

終極指南大數據

1.須要哪些技能以及如何掌握?

說實話,要掌握數據科學領域全部技能幾乎是不可能的,由於範圍太廣了。總有一些技術是數據科學家沒有掌握的,由於不一樣的業務須要不一樣的技能。

但有一些核心技能是數據科學家所必須掌握的。

技術能力,數學和統計學,編程和商業知識。儘管不管使用何種語言,編程能力都是必備的。做爲數據科學家,咱們應該運用商業溝通能力想企業高層說明模型結果,同時基於數學和統計學的支持。

數學和統計學

關於數學和統計學,能夠查看Randy Lao的相關文章,當中的資源很是豐富。

https://medium.com/@randylaosat

當我剛開始學習數據科學時,我讀了這本書 An Introduction to Statistical Learning — with Applications in R(統計學習導論 - 與R中的應用)。我強烈推薦這本書給初學者,由於本書側重於統計建模和機器學習的基本概念,並提供詳細而直觀的解釋。若是你特別喜歡數學,也許你更喜歡這本書:The Elements of Statistical Learning(統計學習中的元素)。

編程

關於學習編程,特別是對於沒有經驗的初學者,我建議專一於學習一種語言,我我的更喜歡Python,由於Python更容易學習。關於Python或R哪一種語言更好一直都存在爭論,我我的認爲重點應放在如何幫助企業解決問題,而不是使用哪一種語言。

商業知識

最後,我要強調的是對商業知識的理解也是相當重要的。

軟技能

事實上,軟技能比硬技能更重要。在LinkedIn詢問了2000名商業領袖,咱們發現2018年他們最但願員工具有的軟技能包括:領導力、溝通能力、合做能力和時間管理能力。我認爲這些軟技能在數據科學家的平常工做中起着相當重要的做用。

2.如何選擇合適的訓練營和在線課程?

隨着人工智能和數據科學的興起,大量課程課程、訓練營如雨後春筍般涌現,都不但願錯失良機。

所以問題來了,該如何選擇適合你的學習資源呢?

個人選擇方法以下:

沒有一門課程能涵蓋你須要的全部資源。有些課程在某些方面是重疊的,所以不值得花錢購買不一樣但有重複性的課程。

首先要知道你須要學什麼。不要由於花哨和吸引人的標題就盲目選擇課程。經過查看求職網站上數據科學家的職位描述,你會發現一些公司須要的通用技能。而後經過了解本身缺少的技能去搜索相應課程。

比較不一樣平臺提供的優質課程。類比幾個課程,而且查看其餘人的評論(很是重要!)。另外一方面,Coursera、Udemy、Lynda、Codecademy、DataCamp、Dataquest等平臺也提供許多免費課程。

如下是我我的特別喜歡的一些課程:

1.Machine Learning ,主講人: Coursera的聯合創始人吳恩達

2.Python for Data Science and Machine Learning Bootcamp,主講人 :Jose Portilla

3.Deep Learning A-Z™: Hands-On Artificial Neural Networks,主講人: Kirill Eremenko,Hadelin de Ponteves

4.Python for Data Science Essential Training ,主講人:Lillian Pierson

5.The Ultimate Hands-On Hadoop — Tame your Big Data,主講人:Frank Kane

3.可否經過開源學習成爲數據科學家?

我想說的是,經過開源學習足以讓你開始從事數據科學,以後能夠根據業務需求進一步發展本身的職業生涯。

4.對於零基礎的初學者有什麼推薦的書籍嗎?

沒有固定的學習途徑,條條大路通羅馬。閱讀相關書籍是掌握基礎知識的良好。

注意不要試圖去記憶具體的數學和算法細節,由於當應用於實際問題進行編程時,你可能會忘記這些內容。

你只需瞭解必定的基礎知識,並繼續學習,要務實。不要試圖徹底瞭解全部知識,由於有時完美主義會給你的學習拖後腿。

關於Python、機器學習和深度學習的基礎知識,我推薦如下書籍:

Learning Python

Python for Data Analysis

An Introduction to Statistical Learning

Machine Learning for Absolute Beginners

Python Machine Learning

Python Data Science Handbook

Introduction to Machine Learning with Python

Deep Learning with Python

Deep Learning with Keras

5.如何在理解商業問題(制定解決方案)和提升技術技能(編程、數學知識等)之間取得平衡?

在理解商業問題和制定解決方案以前,我首先去提升本身的技術技能。

商業問題在於」是什麼」和」爲何」。要解決商業問題,首先必須解決問題。而技術技能是注重於」怎麼作」。個人建議主要基於我的經驗。

6.如何克服開啓數據科學家職業生涯的挑戰?

對於許多數據科學家來講,主要挑戰就是數據科學是信息的海洋。咱們可能失去方向,由於有太多的建議和資源,大量的在線課程、研討會等等,你須要保持專一,知道你擁有什麼,你須要什麼。

在個人數據科學歷程中,我主要經過這些方法克服這些挑戰:

有效地篩選學習資源

在剛開始時,我由於大量的資源感到困惑。經過聽數據科學家的播客,閱讀如何開啓數據科學領域的文章,嘗試不一樣在線課程。最終我關注我在本文中分享的這些優質資源。

不要放棄

當學習過程太過艱難時,我開始懷疑本身,我真的有能力作到嗎?我追求的道理是正確的嗎?最終對數據科學的熱情和耐心讓我從新開始,繼續不斷努力和前行。

得到數據科學相關的工做

因爲就業市場競爭激烈,找到心儀的數據科學工做對我來講並不是易事。我提交了大量的簡歷都毫無結果。所以我開始改進找工做的方法,參加聚會和研討會,在網上分享個人學習經歷,在招聘會上於潛在僱主接觸等等。

7.如何有效地在簡歷中加入本身的工做經驗,從而提升被錄用的概率?

這是一種誤解,你並不能經過簡歷中的經驗就被聘用。事實上,簡歷是面試的敲門磚。

所以,學習如何寫簡歷對於得到面試機會相當重要。研究代表,招聘人員在肯定求職者是否適合該職位時,平均看簡歷的時間僅爲6秒。

關於完善簡歷,我推薦如下網站和文章:

Vault

TopResume

Optimize Guide

A Resume Expert Gives Career Advice

https://www.facebook.com/busi...

How to Pass the 6-Second Resume Test

https://www.topresume.com/car...

How to tailor your Academic CV for Data Science roles

https://www.linkedin.com/puls...

What do Hiring Managers Look For in a Data Scientist’s CV?

https://www.linkedin.com/puls...

The 14 Things You Need On Your Resume To Land Your Dream Job

https://www.elitedaily.com/mo...

8.怎樣的做品集能幫助咱們找到第一數據科學或機器學習方面的工做?

簡歷是不夠的,你還須要做品集的支撐。在看了簡歷以後,招聘人員但願更多地瞭解你的背景,這時就須要做品集了。

能夠試着在社交媒體平臺分享本身的學習經歷,寫文章和作播客都是不錯的選擇。

更多資源

學習平臺 :

Towards Data Science, Quora, DZone, KDnuggets, Analytics Vidhya, DataTau, fast.ai

推薦視頻:

Webinars——Data Science Office Hours, Data Science Connect, Humans of Data Science (HoDS)

推薦文章:

A Badass’s Guide to Breaking Into Data

http://www.data-mania.com/blo...

10 Must Have Data Science Skills

https://www.kdnuggets.com/201...

My Data Science & Machine Learning, Beginner’s Learning Path

https://www.linkedin.com/puls...

24 Ultimate Data Science Projects To Boost Your Knowledge and Skills

https://www.analyticsvidhya.c...

值得關注的數據科學家

LinkedIn上的數據科學社區很是棒,如下是我認爲值得關注的數據科學家和專業人士:

Randy Lao

Kyle McKiou

Favio Vázquez

Vin Vashishta

Eric Weber

Sarah Nooravi

Kate Strachnyi

Tarry Singh

Karthikeyan P.T.R.

Megan Silvey

Imaad Mohamed Khan

Andreas Kretz

Andriy Burkov

Carla Gentry

Nic Ryan

Beau Walker

結語

但願本文可以解決你的問題。每當你在數據科學旅程中遇到任何障礙,快要放棄時請記住,堅持是關鍵。

相關文章
相關標籤/搜索