原書地址:Springboard- Ultimate Guide to Data Science Interviewshtml
原著做者:Roger Huang、Sri Kanajan面試
歡迎來個人簡書:呆鳥的譯Py胡言算法
# 目錄
* 譯序
* 前言
* 什麼是數據科學?
* 數據科學崗位
* 各種公司如何看待數據科學
1. 開發數據產品的創業公司(200人及如下規模)
2. 分析自有數據的創業公司(200人及如下規模)
3. 分析自有數據的財富500強大中型公司
4. 自有成熟數據團隊的大型科技公司
* 聘用數據科學家的行業
* 得到數據科學麪試機會
* 通往數據科學麪試的九條途徑
* 得到面試機會的傳統途徑
1. 官網招聘版塊與標準求職
2. 第三方招聘公司
3. 參加招聘會
* 得到面試機會的主動途徑
4. 組織或參加數據科學活動
5. 打造本身的文集
6. 參與開源項目或開放數據項目
7. 參加數據科學競賽
8. 喝杯咖啡,信息化約談
9. 數據駭客鬆
* 與第三方招聘公司合做
* 如何提出求職申請
* 簡歷 VS 領英
* 求職信 VS 電子郵件
* 請人推薦,讓人脈爲你服務
* 準備面試
* 面試內容
1. 電話面試
2. 家庭做業
3. 招聘經理電話面試
4. 招聘經理現場面試
5. 技術挑戰
6. 總監面試
* 數據科學崗位技能矩陣
* 數據科學崗位縱覽
* 數據科學麪試題
* 行爲試題
* 數學試題
* 統計學試題
* 編程試題
* 場景試題
* 面試提示
* 招聘經理的想法
* Will Kurt(Quick Sprout公司)訪談
* Andrew Maguire (PMC/谷歌/Accenture) 訪談
* Hirsto Gyoshev(MasterClass公司)訪談
* 求職者的成功經驗
* 結論面試後要作的7件事
1. 面試後,寄出感謝信,保持跟進
2. 列出對面試問題的想法,寄給他們
3. 把工做成果/家庭做業寄給招聘公司
4. 保持聯繫,正確的方式
5. 利用人脈
6. 招聘被拒,更要表現出專業性
7. 不要放棄但願
* Offer流程
* 處理Offer
* 薪資談判
* 上班前的準備
* 資料與數據
* 名人名言
* 覈對清單
* 模板
* 術語庫
* 資源
* 關於做者
複製代碼
翻譯這本小冊子的緣起,一方面是看的譯文書多了,英文書也多了,就不由手癢、心癢,想看看本身能不能翻譯,能翻譯成什麼樣子;另外一方面是學了一段數據科學,雖然寫不出原創文章,也編不出漂亮的代碼,但也想以本身的微薄之力,爲這個社區,爲不少和我同樣努力向數據科學大門邁進的朋友作點貢獻,恰巧在Springboard的網站上看到這本指南,免費、公開下載,我想應該沒有什麼版權問題。spring
本指南介紹了數據科學的定義、各個數據科學崗位的技能要求、不一樣行業與公司招聘數據科學人員的側重點、獲取數據科學麪試機會的途徑、數據科學麪試的詳細流程、數據科學麪試的試題種類與示例。爲了更好地說明數據科學麪試,做者採訪了不少已經當上數據科學家的求職者,還有一些公司的數據科學主管,將他們的經驗和想法整理出來,未來自數據科學第一線的思想呈現給你們,最後還列出了大量的資料、文獻與數據,爲求職者瞭解、應對數據科學麪試提供了充足的彈藥。數據庫
本指南不只能指導求職者應對數據科學麪試,也能夠幫助國內各行各業須要招募數據科學人才的公司瞭解數據科學的招聘流程、招聘重點,推進國內公司優化數據挖掘、數據分析、數據開發等數據科學體系的創建、健全,但願此次的翻譯能幫助面試桌兩邊的朋友更好地瞭解數據科學。編程
本指南的做者之一Roger Huang是位華人,在此,感謝他不辭辛勞蒐集資料,採訪了諸多數據科學專家,給咱們呈現了這麼一本完善的數據科學麪試指南;本次翻譯也獲得了Roger的大力支持,幫我指點了很多翻譯中的疑難問題,還主動幫我聯繫Springboard公司的副總裁,得到了他們對發表中文版翻譯的許可。在此,對Roger表示深深的感謝!機器學習
說實話,咱們沒想到爲Springboard編撰的《數據科學職業指南》會這麼火爆,幾天就有數千人訂閱。說明數據科學雖然備受追捧,可是大多數人仍是不知道該怎麼上手,畢竟有關這行的實用資料太少了,這樣的現實堅決了咱們寫下去的決心。編程語言
和不少朋友交流後,咱們發現介紹入行數據科學的文章真是屈指可數,現有資料大多隻是我的經歷或面試題集錦,很難找到從海投簡歷一直講到勝任數據科學各崗位的系統性面試指南。分佈式
我心目中的面試指南,要告訴你們面試桌兩邊的人都有什麼想法。舉薦求職者的第三方招聘公司、發放Offer的招聘經理,還有順利通關的求職者,他們都是我關注的對象,我要講述數據科學麪試裏各方人士的故事。爲此,我和Sri Kanajan,紐約投行的資深數據科學家合著了本書。ide
Springboard培訓過數千名數據科學學員,創建了龐大、專業的社區,爲咱們採集第一手資料提供了獨特的優點。
採集本書資料的過程十分艱難,比數據科學麪試有過之而無不及。想當年,數據科學的領軍人物,美國首席數據科學家DJ Patil等了足足半年纔拿到Offer。現現在,好多公司都把數據科學麪試搞得特別難,彷佛只想招聘最專一、最專業的人才,有時候,就算這方面的高手都過不了關。固然啦,門檻越高,這一行的收入也越高。
數據科學算得上是21世紀最性感的職業。數據科學家能帶來重大的社會影響,繪製世界貧困地圖、阻止疫情爆發、揭開Bansky的神祕身份,再加上一手預測三月瘋狂賽季裏籃球比分的絕活,數據科學家可不僅是高收入、事業生活雙豐收,還能幹些真正了不得的大事。
編寫本書的目的是引導對數據科學感興趣的朋友找到數據科學工做。如今,一塊兒來揭開成功通關數據科學麪試的奧祕,助你大展身手吧!
開始數據科學麪試前,首先要理解這個詞的含義,而後還要搞明白數據科學都包括哪些工做內容。
美國首席數據科學家DJ Patil最早提出了數據科學這個概念。
十年來,這一名詞一直飽受爭議,實幹家與學院派對於數據科學涵義的論辯家常便飯,更可怕的是,他們的理念和數據分析公司經常使用的理念也不同。只要一討論大數據與機器學習數據解決方案,就會發現新詞迭出,讓人目不暇接。
每一個公司對數據科學的涵義都有本身的理解,招聘經理的理解也各不相同,你們都喜歡根據本身的理解來招聘和麪試。數據科學定義隨着公司和崗位變來變去,定義不清使得數據科學麪試困難重重。
下面用一個簡單的數據科學項目說明數據科學的崗位。
某數據科學團隊想效仿Yelp團隊利用深度學習技術識別圖片。
天天上傳到Yelp的照片多達上百萬張,很難爲每家飯店找到適合顯示的圖片。有時上傳的都是同類照片,要麼是食物,要麼是飯店外景,可是想全面評價一家飯店須要不一樣類別的圖片。
這個團隊想利用機器學習分類照片,自動將照片歸入指定的類別。要實現這個目的須要幫助計算機利用訓練集識別哪些照片是飯店外景,哪些照片只是食物。
數據科學家負責搭建模型,讓機器建立不一樣圖片類別,要從用戶標註過的照片和照片標題的關鍵字裏提取全部相關的數據類型。這是個高端崗位,一般要全方位管理數據產品,搞定從算法選擇到工程設計等方面的數據科學問題。
數據工程師負責搭建系統,獲取並存儲全部圖片數據,實現數據科學家選定的算法。這個崗位須要很強的技術實力,可是不須要深刻理解算法理論。
數據分析師負責查詢數據、展現業務變化帶來的影響。用戶滿不滿意?最近的改版爲Yelp帶來了多少流量?這些都是數據分析師要提出和解答的問題,此外,數據分析師還要和其它崗位的同事溝通數據分析結果。這是個入門級的崗位,數據科學新人或有必定技術能力的業務人員就能夠勝任。
後文還會提到更多數據科學崗位。如今只要知道這三個數據科學崗的面試不同就能夠了,其實,大部分狀況下,各個數據科學崗位的面試都不同。
不但數據科學各崗位的面試要求不同,各種公司對數據科學麪試的要求也不同。能夠把公司大體劃分爲4類:
歡迎來到硅谷的心臟,創業公司是技術人員的浪漫國度,不少創業公司短時間內就能取得驚人的成績。加入創業公司,要作好一人多職的心理準備,不少時候一我的要兼任三個數據科學崗位的工做,並且可能永遠也得不到想要的資源,加班加點,累死累活更是屢見不鮮。
這類公司的招聘門檻大多高的嚇人。無論是爲其它公司提供數據優化的平臺,仍是用機器學習分析數據集,這類公司都但願求職者具備很高的水平,他們對數據處理技能的要求遠高於那些只處理內部數據的公司。這類公司的創始人大多都是數據科學精英,或者曾經當過大型數據科學團隊的領導。他們招聘的都是頂級人才,要有豐富的從業經驗、突出的發展潛力和強大的自我推進力。加入這樣的公司多是這輩子最好的學習機會,不過,也要作好面對數據科學頂尖挑戰的心理準備。
公司示例:Looker、Mode Analytics與RJMetrics。
崗位實例:數據分析師(Looker),高級分析師(Mode Analytics)。
高級分析師
Mode是一家爲分析師服務的公司,咱們的產品可讓分析師的工做效率更高、效果更好。咱們的目標是爲各行各業的分析師提供教育與激勵服務。
數據分析團隊是實現這一目標的核心力量,身負兩大使命。第一,服務於產品、營銷和銷售團隊,協助他們制定更科學的決策。第二,爲但願實現數據驅動轉型的公司或分析師提供開源資料和分析服務。
崗位職責:
咱們心目中的人選:
公司規模:143名員工使用領英(11-50人的公司規模)
崗位解讀:本崗位的重點是溝通能力、數據庫查詢能力、利用編程語言實現數據可視化的能力,說明這是個業務崗,與相關團隊溝通數據分析結果是必備能力。
這類創業公司只分析自有數據,不向其它公司銷售數據產品。所以,招聘門檻比前一類公司略低。不過度析自有數據對創業公司同樣相當重要,所以這類公司的招聘門檻每每也會很高。
IT類創業公司裏技術天才不少,不過能爲業務與技術搭橋的人才也不可或缺,要是公司裏各部門對理解和使用數據互不相讓,這樣的人才就更重要了。在數據驅動型公司工做,要作好吃苦耐勞的心理準備,還要能不斷拓展思路,爲公司各部門採集數據、使用數據推薦新工具,制定新流程。
在處理自有數據的公司工做,很是考驗數據分析師的水平,要在公司裏持續推廣、強化數據驅動型的企業文化。趕忙提升本身的領導能力與溝通技巧吧!
還有,B2B與B2C創業公司的數據問題也不同。B2B是商對商,將軟件產品直接賣給其它公司,Salesforce就是其一。B2C則是服務於廣大消費者,好比亞馬遜。B2B公司的數據量通常不大,但特別在乎數據細節與數據特徵。這類公司的客戶主要是企業客戶,數量很少,但都很重要,由於每一個客戶都會帶來鉅額收入。B2C公司的客戶量極大,數據問題主要是數據規模龐大,過分關注消費者個體會分散其對消費者羣體的注意力。B2B公司可能只有1000個客戶,但每一個客戶每個月可能會消費上千美圓,而B2C公司可能有100000個用戶,但每一個用戶每個月能有1美圓的收益就不錯了。
求職者必定要深刻了解面試的公司及其數據問題,作足功課,確認能在該公司滿懷激情地工做,具有的專業技能最好也要和該公司的崗位職責相匹配。
公司示例:Springboard、Branch、Rocksbox、Masterclass與Sprig
崗位實例:Branch公司 首席數據科學家,Rocksbox公司 數據(研究)科學家,Masterclass公司 數據科學家等。
數據科學家(決策科學家)
Masterclass
崗位職責
公司簡介:
Masterclass致力於讓來自世界各地的朋友都能得到最好的在線教育。演員爲何感情這麼豐富?運動員怎麼能抵抗地心引力?暢銷書做者又是如何煉成的?咱們的課程將對這些問題爲您一一解密。做爲咱們的學員,您能夠隨時隨地學習在線課程。至於那些天才寶寶,您可有福了,能夠享受每節課一次免費試聽的優惠待遇。
咱們是風投提供資金支持的創業公司,目前正處於高速發展期。公司位於舊金山,現已聘請各行各業的專家錄製了大量在線課程,從此還有更多課程持續上線。2015年起,咱們開始搭建本身的數據團隊,如今就申請加入咱們吧!
咱們心目中的人選:
公司規模:37名員工使用領英(11-50人的公司規模)
崗位解讀:尋找樂於鑽研問題的通才,能對各類數據分析結果進行溝通。說明這是個多面手型的數據科學崗位。勝任這個崗位須要有積極主動的工做態度,還要有創業精神。
世界級的大公司深知使用自有數據的重要性。很多公司已經組建了強大的數據科學團隊,並提供充足的資金支持,使其安心開展數據科學工做。這些數據團隊有點像大公司內部的創業公司,幫助公司將數據轉化爲商務洞察結果。還有不少公司意識到數據對保持競爭力的重要性,爲此不惜招募整個數據科學團隊。利用好自身優點,說不定就能輕鬆經過這些知名大公司的數據科學麪試。
雖然這些公司的企業文化已經成形,甚至還有官僚做風,多多少少會給創新帶來更多困難,但擁有百萬客戶數據能夠爲數據科學帶來無限可能。以沃爾瑪的採購數據爲例,這但是百萬量級的數據,分析結果會影響千萬人的生活。
雖然這類公司通常不會研發尖端數據科學解決方案,但處理他們的數據集依然是一種挑戰,和他們的精英員工一同工做,也能讓你受益不淺。
公司實例:沃爾瑪、JP摩根、摩根斯坦利、可口可樂、第一資本
崗位示例:摩根斯坦利 數據科學家與建模師 ,第一資本 數據工程師
數據工程師
職位ID:R5046
發佈日期:2016年6月16日
工做所在地:弗吉尼亞州,麥克林市
第一資本是業內領先的高科技信息技術公司。在公司創始人、董事長與CEO,Richard Fairbank的引領下,多年以來,咱們一直努力爲客戶提供首創、精簡和人性的銀行服務,咱們以幫助客戶取得成功爲使命,客戶的成功就是咱們的成功,客戶的滿意就是咱們的標準。
在共同價值觀的指導下,咱們視合做與開放爲核心價值,相信快人一步的創新、同心合力的團隊,只要互相扶持,以作正確的事情爲準則,必能創造卓越的成就。咱們的合夥人爲客戶服務全力以赴,全力協助客戶達成目標、實現夢想,共同爲把銀行業變得更好而努力。
咱們心目中的人選:
想用數據引爆軟件的能量嗎?開發過引覺得豪的應用嗎?喜歡優雅的數據解決方案嗎?第一資本正在尋求一位資深數據工程師,可以開發語言優雅、擴展性強的數據解決方案,經過內外部客戶觸點,改變業界遊戲規則,提交用戶體驗分析成果。 做爲引領下一波新浪潮的銀行客戶團隊成員,您將領導整個團隊不斷完善第一資本的生態系統,最終建立技術爲王的企業文化。您的職責涉及引入Kafka消息隊列技術,落實Hadoop、Dynamo、Redshift、Cassandra、Mongo等大數據解決方案、實現API、微服務及分佈式處理等。
公司規模: 超過30,000名員工使用領英(10,000+人的公司規模)
崗位解讀:關注大數據工具,說明這是個很是專業的崗位,須要掌控第一資本龐大的數據資源。
大型科技公司也在不斷孵化成長,他們對數據的癡迷源於當年創業公司的初心,只不過他們的數據規模已經達到甚至超過了百萬量級。優步、Airbnb、Facebook和谷歌等世界級大公司有着業界頂尖精英領導的技術團隊,這類公司的數據科學人才專業性極高,能夠用最狂野的革新思想應對最前沿的數據問題。
若是你渴望挑戰、嚮往處理大規模數據,必定要加入這些頂級公司。雖然在這裏你的優點不如在創業公司明顯,可是這些公司福利好、薪資高、團隊成員極其優秀 — 就算未來想換工做,這裏的工做履歷也能讓你的簡歷高人一等。
公司實例:Facebook、谷歌、Airbnb 崗位示例:Oculus 數據分析師,Airbnb 機器學習數據分析師
數據與分析
數據科學家、數據分析師(Oculus)
Facebook對促進世界溝通與共享作出了巨大的貢獻,過去的十年裏,咱們的產品改變了整個世界的溝通方式。咱們在全球超過五十個國家設立了分公司,十幾億人使用咱們的產品與服務,在Facebook工做爲您提供了無限的可能。Facebook對促進世界溝通與共享作出了巨大的貢獻,過去的十年裏,咱們的產品改變了整個世界的溝通方式。咱們在全球超過五十個國家設立了分公司,十幾億人使用咱們的產品與服務,在Facebook工做爲您提供了無限的可能。
咱們的子公司Oculus一直在尋覓既熱衷於虛擬現實,還能驅動數據化業務決策的數據產品科學家。在這裏,您能夠操控世界上最複雜的數據集、使用最前沿的技術,在平常工做中,您的洞察結果將會變爲影響整個世界的產品。理想的求職者要有量化分析與技術背景,具備操做大規模數據集和數據驅動決策的經驗。應當關注結果、積極主動、可以使用數據分析技術帶動產品理研發理念、促進產品開發,最終推出成功的產品。
公司規模:16,715名員工使用領英(10,000+人的公司規模)
崗位解讀:本崗位指出求職者應該是勇於創新的全面型人才,屬於開放式數據科學崗,招聘方但願求職者能推進新項目的開展,自始至終引導團隊開展工做。