爲何數據科學家們老是在離職的路上

clipboard.png

clipboard.png

相信在這個時代的當下,你們或多或少都有看到過相似「數據科學是21世紀最性感工做」的故事,以及數據科學家在這個時代顯得是一份十分理想且具備超強吸金能力的工做。由於這個領域須要大量高技能人才,他們須要尋求解決複雜問題的辦法(這對於「極客」來講是一件頗有吸引力的好事)。總之,你們的描述都讓這份工做在技術人的眼中顯得十分夢幻、可愛。算法

但事實是,正如英國《金融時報》在這篇文章中所說,數據科學家一般「每週花1-2小時尋找新工做」。此外,文章還指出,「機器學習專家在說他們正在尋找一份新工做的開發人員中排名第一,佔14.3%。數據科學家緊隨其後,佔13.2%,「這些數據是在他們對64000名開發者的調查中經過堆棧溢出的方法收集的。數據庫

做爲數據科學從業人員,我也一直有着這樣的狀態和想法。網絡

那麼爲何有這麼多數據科學家在尋找新的工做呢?架構

在回答這個問題以前,我應該澄清一點,我仍然是一名數據科學家。總的來講,我很喜歡這份工做,我不想讓其餘人不想成爲數據科學家,由於這份工做真的是有趣的、刺激的和有意義的。本文的目的是扮演一個魔鬼的倡導者並袒露這項工做的一些消極方面。機器學習

從個人角度來看,許多數據科學家對他們的工做不滿意主要有如下4個緣由:oop

1.指望與現實不符學習

clipboard.png

Big data is like teenage sex: everyone talks about it, nobody really
knows how to do it, everyone thinks everyone else is doing it, so
everyone claims they are doing it… — Dan Ariely

這句話很是貼切。我所知道的許多初級數據科學家(包括我本身)都想進入數據科學領域,由於它是一種經過酷炫的機器學習算法來解決複雜問題的方法,這些算法對業務將會產生巨大的影響。這是一個讓咱們以爲咱們所作的工做比之前作過的任何事都重要的機會。可是,現實每每與咱們想象的相去甚遠。測試

在我看來,指望與現實不符是許多數據科學家選擇離開這個領域的最終緣由。優化

每一個公司都有所不一樣,因此我不能表明全部的公司,但許多公司僱用數據科學家但卻沒有適當的基礎設施來支持從AI中獲取價值。這有助於AI中的冷啓動問題。再加上這些公司在僱用應屆生以前沒有聘請資深/經驗豐富的數據從業者這一事實,這也是致使雙方都失望和不滿的緣由之一。數據科學家多是但願來編寫智能機器學習算法來提升洞察力的,但實際工做中卻沒法作到這一點,由於他們的第一項工做是整理數據基礎架構和/或建立分析報告。相比之下,公司只想要一張他們天天能夠在董事會會議上出現的圖表。網站

Robert Chang在他的博客文章中給出了一個對於年輕數據科學家很是有見地的建議:

重要的是要評估咱們的願望與咱們所處環境的關鍵路徑是否一致。尋找那些關鍵路徑與你最爲一致的項目、團隊和公司。

這突出了僱主和數據科學家之間的雙向關係。若是公司的位置不匹配,或者與數據科學家的目標不一致,那麼數據科學家跳槽真的只是時間問題。

數據科學家們幻想破滅的另外一個緣由就是:我相信我作的事情可以對這個世界產生影響,而不只僅是在公司內部。實際上,若是公司的核心業務不是機器學習(我之前的僱主是媒體出版公司),那麼你所作的數據科學極可能只能提供少許的增量收益。那種你作的事情是一個項目中很是重要、不可獲取的一部分,或者你可能很幸運地遇到了一個很是棒的項目的機會的狀況並不常見。

二、公司需求占主導地位

clipboard.png

若是你認真地認爲知道不少機器學習算法將使你成爲最有價值的數據科學家,那麼回到個人第一點:指望與現實不符。

事實上,若是但願公司老闆或業界專業人士對你有一個好印象,這可能意味着你必須常常作一些特別的工做。好比從數據庫中獲取數據,以便在正確的時間提供給合適的人員,作一些簡單的項目。在我之前的地方,我不得不這麼作。儘管這話說出來使人沮喪,但這是工做的必要部分。

三、你什麼都知道

clipboard.png

爲了讓老闆們滿意,數據科學家們不得不什麼都作。由於對於老闆和同事而言,他們真的對於「數據科學家」到底是作什麼的,徹底沒有概念。他們認爲你就是作數據分析,而且把這些分析結果以報告形式呈現給老闆的人。

不只僅是非技術人員對你的技能作了太多的假設。其餘技術領域的同事也將會認爲你知道全部與數據相關的事情。好比他們以爲你應該是熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B測試、NLP等等任何你能想到的機器學習的技能的(以及任何你能想到的其餘相關數據——順便說一句,若是你看到一個包含全部這些內容的工做要求,請你清醒點!由於這意味着這份工做要求來自一家不知道本身的數據策略是什麼的公司,他們會僱傭任何人,由於他們認爲僱傭任何數據人員都能解決他們全部的數據問題)。

這樣的臆斷尚未結束!你的老闆和同事們不只認爲你知道全部的數據算法,同時還有你還應該能夠獲得全部公司內外的數據,經過……emmm,我相信做爲數據工做者的你,應該5分鐘前在你的郵箱中看到過相似的要求。

試圖去告訴每一個人你能作的和正在作的事情實際上是很難的。這並非由於有人會真的看不起你,而是由於做爲一個缺少行業經驗的初級數據科學家,你會擔憂你們看不起你。這其實挺矛盾的。

四、在一個獨立的團隊中工做

clipboard.png

當咱們看到成功的數據產品時,咱們常常會看到專業設計的具備智能功能的用戶界面,其中最重要的是,它會有一個有價值的輸出,讓用戶感知到咱們爲他解決了一個問題。而現在,若是一個數據科學家只把時間花在學習如何編寫和執行機器學習算法上,那麼在一個可以成功地開發出一個有價值產品的團隊中,他們就只能是其中最基礎和底層的部分(儘管是必要的)。

儘管如此,許多公司仍然擁有數據科學團隊,他們會提出本身的項目並編寫代碼來嘗試解決問題。在某些狀況下,這就足夠了。例如,若是所須要的只是一個每季度生成一次的靜態電子表格,那麼這些行爲能夠提供一些價值。另外一方面,若是目標是在定製的網站構建產品中優化提供智能建議,那麼這將涉及許多不一樣的技能,這是絕大多數數據科學家不該該奢望的(只有真正的數據科學獨角獸才能解決這個問題)。所以,若是這個項目是由一個獨立的數據科學團隊承擔的,那麼它極可能會失敗(或者須要很長時間,由於在大型企業中組織獨立的團隊從事協做項目並不容易)。


所以,要成爲行業中拔尖的數據科學家,僅僅在Kaggle競賽中取得好成績並完成一些在線課程是不夠的。幸運/不幸的是,(這取決於您如何看待它),它涉及到理解企業中的制度規則和一些工做環境上的軟技能。在尋找一份能知足你需求的數據科學工做時,找到一家與你的職業規劃路徑一致的公司應該是一個關鍵目標。然而,你可能仍然須要從新調整對數據科學角色的指望。

原文連接:https://towardsdatascience.co...

clipboard.png
以上信息來源於網絡,由「京東雲開發者社區」公衆號編輯整理,不表明京東雲立場。

clipboard.png

相關文章
相關標籤/搜索