做者 | Jeremie Harris面試
翻譯 | Mika數據庫
本文爲 CDA 數據分析師原創做品,轉載需受權編程
在大學我學習物理時,每當遇到不理解的術語,我就會上網搜索,這時我常會用到的就是維基百科。後端
雖然維基百科很好用,可是上面不少文章都不適合個人水平。那些文章要不就是超出個人理解,或者對我來講太簡單了。這種狀況時常發生,所以我從中總結的經驗就是,維基百科上的技術詞條很難既提供有效信息,又作到易於理解。機器學習
不少數據科學方面的職業建議也是如此,有些是針對徹底零基礎的初學者;有些是針對初級數據科學家磨練技能;有些則針對資深的軟件工程師。而這容易讓許多想成爲數據科學家的人羣感到無從下手,他們不知道該如何花在哪裏。模塊化
在本文中,我打算針對三種不一樣類型的人羣給出相應的職業轉型建議。學習
第一類:零基礎的初學者測試
若是你剛剛進入數據科學領域,請記住該領域的發展速度很是快,也許如今我給出的建議在你準備求職時已通過時了。現在數據科學的招聘標準與一兩年後的標準之間的差距可能會更大。spa
在明確這點的基礎上,若是你想進入數據科學領域,而且沒有任何編程方面的背景,我要給出的建議以下:翻譯
首先要保持開放的心態
若是你是一名初學者,那麼你可能徹底不知道數據科學的具體內涵。那麼能夠先和一些數據科學家聊一聊;關注相關的科學播客。成爲一名數據科學家須要花費大量的時間和精力,所以只由於你認爲自動駕駛汽車很酷就一頭扎進去,這並非一個很好的理由。確保本身瞭解數據科學中不那麼高大上的部分,數據處理和構建數據管道等,這些方面佔數據科學家平常工做的大部分。
若是你決定繼續前進,這太好了!首先你要作的第一件事就是學習Python。參加一些在線課程,並儘快創建一個基礎項目。當你掌握必定Python技能時,學習如何使用Jupyter notebook。
在找工做時,一開始就從全面的數據科學職位並非最好的。相反,能夠選擇數據可視化或數據分析職位,這類職位市場需求量大,並且要求沒有數據科學家那麼高。這些職位常常與數據科學家一塊兒工做,當你得到了一些經驗後,也能夠着手向這個方向發展。
如何發揮本身的優點:
當你準備好找工做時,你會發現學會推銷本身在在數據科學中很是重要。你可能會擔憂,由於你沒有任何專業經驗或計算機科學的研究生學位,推廣本身是一個難題。但這也能夠成爲你最大的優點:你是從零開始,自學成才的數據科學家,公司須要這些努力並且學習能力強的數據科學家。爲此你須要符合本身的這種形象,不斷提升技能,解決一個個挑戰,但當中的回報絕對是值得的。
第二類:軟件工程師
我遇到的想成爲數據科學家的人中,可能有20%都是軟件工程師。一方面,有將代碼部署到生產和與開發團隊合做的相關經驗,這是很是重要的資產。另外一方面,現在對全棧開發人員的需求很是高,有時公司會將軟件工程師歸爲這個方向。所以想轉爲數據科學家時,你要避免被看成軟件工程師,而不是數據科學家。
其餘建議:
首先你能夠考慮轉爲專一後端或數據庫相關方向。熟悉數據管道是一個良好的開端,這能夠幫助你構建核心數據操做技能組。
機器學習工程多是最接近數據科學的職位,這更容易過渡。在求職時,你能夠找哪些強調部署模型,或將其集成到現有應用程序的職位,這些職位將最有效地利用你現有的技能。
你極可能要創建機器學習或數據科學項目來打動僱主。利用你的軟件工程技能,將這些技能整合到能夠向招聘人員展現的應用程序中。這特別有效,由於這更爲明確,並且突顯了你做爲全棧數據科學家的潛力。
要記住,在職業轉型時你的薪資極可能會減小。即便是高級軟件工程師,當他們轉行數據科學時,也須要從初級的職位開始。
如何發揮本身的優點:
最好的方法就是利用你在軟件開發方面的經驗。你已經知道如何編寫乾淨、文檔記錄良好的代碼,以及該如何與他人協做,這是大多數初級職位求職者所缺少的優點。
第三類:計算機科學、數學或物理專業的應屆畢業生
若是你是一名本科、碩士或博士生,你可能在統計學和數學方面有很好的基礎。但你可能從未申請過科技方面的工做,並且你不肯定如何準備面試。此外,假設你讀書時一直在編程,你極可能沒法寫出乾淨、結構良好的代碼。
幾點建議:
你在讀書期間學的R語言還不夠。若是你是學物理的,那你的MATLAB或數學技能也是不夠的,去學學Python吧。
這些內容你須要儘快學習:協做版本控制,好比如何與其餘人一塊兒使用GitHub);容器化,好比如何使用Docker;開發運營,學習如何使用AWS或其餘相似服務在雲中部署模型;SQL也是必須的。
學習Python中的測試驅動開發。學習如何使用文檔字符串,如何將代碼模塊化,以及如何使用Jupyter notebook。
若是你在以數學爲導向的領域,那麼深度學習是一個很好的探索方向。要注意先從更傳統的「scikit-learn」型數據科學職位開始,而後轉向深度學習更容易。對你來講,最重要的是先入行,並儘快開始生產代碼。
如何發揮本身的優點:
若是你是數學或物理專業,你最好的策略就是發揮有深厚理論知識的特定。爲此,你須要可以自信地解釋各類模型的原理,熟悉文獻中最新的文章。
結語
注意:我這裏提供的建議並不能徹底使用與全部狀況。有些軟件工程師可能要學習的更多,而有些初學者有很好的數學基礎,更適合成爲深度學習研究人員。但但願本文能你一個不錯的起點。
最後,不管你是軟件工程師,剛畢業的大學生,仍是零基礎的初學者,你都要問本身一個關鍵的問題:哪一種職業發展軌跡最接近你的狀況?不少狀況下,經過稱爲數據分析師或數據可視化專家進入該領域都是不錯的選擇。