專欄 | 九章算法
網址 | www.jiuzhang.com程序員
數據科學家(Data Scientist)被《財富》雜誌譽爲21世紀最性感的職業。據調查顯示,僅僅在美國市場,2018年大數據和高級分析相關人才的缺口就將高達19萬。然而雖然如今不少人對這份職業躍躍欲試,可是卻對這份新興職業並不瞭解,更不知道應該如何準備面試。web
下面咱們就來簡單介紹一下什麼是數據科學家,以及咱們應該如何準備數據科學家面試,但願能對想要從事這一職位的朋友有所幫助。面試
什麼是數據科學家算法
「數據科學家」在2009年由Natahn Yau首次提出,簡單來講數據科學家就是指能採用科學方法、運用數據挖掘工具對複雜多量的數字、符號、文字、網址、音頻或視頻等信息進行數字化重現與認識,並能尋找新的數據洞察的工程師或專家(不一樣於統計學家或分析師)。數據庫
一個優秀的數據科學家須要具有的素質有:
懂數據採集、懂數學算法、懂數學軟件、懂數據分析、懂預測分析、懂市場應用等。編程
在初步瞭解了數據科學家這一律念後,咱們來重點研究一下應該如何準備數據科學家面試。api
如何準備數據科學家面試微信
1.瞭解你申請的崗位所需的技能數據結構
數據科學家這個職業的定義很普遍。在不一樣行業不一樣公司,即便崗位名稱一樣叫作數據科學家,他們的工做內容也多是不同的。這也就是說這個職業有不少分類。機器學習
好比:
若是這個職位對你的編程能力要求很高,那麼,建議你看一看與軟件工做師有關的面試題。
若是這個職位要求你有很高的統計技術,而且須要你瞭解不一樣的人口分佈、懂得如何設計實驗、熟悉如何設置A / B測試和假設測試等,你就要對這些內容進行學習和練習。
因此在面試前,你必定要明確你申請的崗位所要求的技能和職責,由於這決定着你面試時會遇到什麼樣的題目。
2.向招聘人員詢問面試流程
向招聘人員詢問面試流程,瞭解準備面試時可使用哪些資源以及面試時的着裝要求。
能夠的話,詢問一下面試官的姓名,這樣你就能夠在網上查找他們的相關資料,從而瞭解他們的專業領域等信息,並就此做準備,會起到事半功倍的效果。
3.在網上查找以往的面試題
你能夠在網上查找你將要面試的公司數據科學家這一崗位的相關面試題,包括行爲問題和技術問題。
就算你找不到你將要面試的公司的面試題,你也能夠看看其餘公司的面試題,讓心中對面試問題的類型有個大致瞭解。
4.提早準備好行爲問題的答案
在面試前你要提早準備好你可能遇到的行爲問題以及這些問題的答案。
好比說你可能遇到這些問題:
你對要工做的內容感興趣嗎?
你會如何對待團隊工做?
你願意作一些煩人的工做嗎?好比清理雜亂的數據。
在這個行業,每一個公司都想努力解決的問題是什麼?你和你的團隊將如何發揮做用?
想要回答好這些問題,你能夠查找相關資料並結合自身經驗在面試前準備好這些問題的答案,這樣當你面試過程當中遇到這些問題時,你就能邏輯很清晰的表達出來。
5.仔細閱讀招聘要求
查看你那份工做的招聘要求,從中挖掘出你的優點和興趣。並在面試官根據這些要求提問時說出你的興趣和優點。這樣不只能體現出你對這份崗位的精準瞭解,並且能表現出的你的專業能力,從而讓你在面試中脫穎而出。
好比:
招聘要求:精通X語言。
面試時:可突出——我自己會Python,因此我學公司要求的X語言是很快的。
招聘要求:會用不一樣的NLP模塊分析文本。
面試時:可突出——我很擅長用不一樣的NLP模塊分析文本,並加以舉例。
招聘要求:熟練掌握web-scraping和web-pages-inspecting
面試時:可突出——我會用web scrap和查找web頁面寫一個爬蟲,並舉例。
招聘要求:能在SQL和NoSQL數據庫找數據。
面試時:可突出——我很擅長在SQL和NoSQL數據庫找數據並基於這些數據分析模塊。
6.熟悉你的項目經歷
每輪面試前,重溫一下本身的簡歷。由於,大多數面試官會根據你簡歷上所寫的項目進行提問。因此,作一個perfect的總結相當重要。
準備工做:
翻看你的項目資料,回顧一下技術細節。
準備一下你在設計項目時使用數據科學的過程,裏面須要包括:你爲何選擇這個方法、你對項目的我的貢獻、你遇到的挑戰、你在這個過程當中學到的東西。
多加練習,確保你的總結是連貫的。
7.編程(一般要求在白板上寫)
若是你的工做職位須要考察編程能力的話,那麼你須要開始如下的準備工做:
掌握基本的算法以及數據結構和算法複雜度。
練習在白板或記事本上編碼,熟悉這種感受。
練習的時候給本身定時,以避免面試時因有時間限制而過分緊張。
若是沒有太多軟件工程經驗,能夠找精通的朋友幫忙。
面試時:
確保你徹底理解題目意思,不清楚的地方要提早問面試官。樣式
寫代碼前,先將方法告訴面試官,讓他們能夠對你的設計提出優化建議,從而節省時間。
除非面試官提出,不要寫到一半去檢查無效輸出。通常狀況下,面試官不會在乎這個。
寫完代碼後,注意檢查一下變量初始化、結束條件和邊界狀況。
8.瞭解和應用機器學習理論
有的數據科學家職位對機器學習知識有必定的要求。
機器學習理論將測試你對基本機器學習概念的理解,通常側重於監督式學習。
對於機器學習理論,你應該瞭解:
監督式學習系統的通常設置
爲何要將數據分爲測試集和訓練集
若是根據樣本數據不能找到廣泛規律,那麼該怎麼辦?(參考答案:用不一樣的樣本數據或者投射到更高的維度空間)
若是樣本數據太多太雜該怎麼辦?(參考答案:對其進行正規化)
此外,面試官也可能考察你的應用機器學習的能力。一般,面試官會讓你想一個算法實現一個預測類的題。
好比:怎麼找出能夠推薦給用戶的書?
回答此類問題,要明確:
對象是什麼?
能夠用的機器學習算法有哪些?
內容列表樣式
根據問題的定義,對不一樣的可能狀況擴展更多的解決方案,問題就迎刃而解了。
對你的聲譽和職業生涯產生影響。
推薦閱讀: