將來 3~5 年內,哪一個方向的機器學習人才緊缺?

  撇開學術界需求由於大部分人最終不會從事算法研究,而會奮鬥在一線應用領域。相較而言,工業界對人才的需求更加保守。這受限於不少客觀因素,如硬件運算能力、數據安全、算法穩定性、人力成本開支等。web

  這個答案可能更適合兩類人: 1. 在讀學生 2. 工做不久想要轉行機器學習的朋友。特別厲害的技術大牛建議探索適合本身的路線,而我只能泛泛談談適合大部分人的路線。但在回答前,我仍是忍不住吐槽一下那種簡單回答「深度學習」,「大數據」,「NLP」,「機器視覺」的人。這每個領域的小方向都多如牛毛,以天然語言處理(NLP)爲例,細分有天然語言生成、天然語言理解,還有不一樣語言的語言模型。任何一個方向花幾十年研究也不爲過,只給出幾個字的答案和買彩票有什麼區別...所以大部分機器學習實踐者仍是該腳踏實地。盲目追逐熱點很容易跌進陷阱,而鞏固基礎、尋找本身擅長的領域和機器學習交叉點能夠幫助你在將來的就業市場變得煊赫一時,成爲工業界最緊缺的人才。算法

  0. 背景安全

  工業界將來須要什麼樣的機器學習人才?老生常談,能將模型應用於專業領域的人,也就是跨領域讓機器學習落地的人。有人會問如今咱們不就須要這樣的人嗎?答案是確定的,咱們須要並將長期須要這樣的人才,現階段的機器學習落地還存在各類各樣的困難。這樣的需求不會是曇花一現,這就跟web開發是一個道理,從火熱到降溫也通過了十年的週期。一個領域的發展有特定的週期,機器學習的門檻比web開發高並且正屬於朝陽期,因此你們致力於成爲「專精特定領域」的機器學習專家並不過期。網絡

  什麼是特定領域的機器學習專家?舉個例子,我之前曾回答「人工智能是否會替代財務工做者」時提到我曾在某個公司研究如何用機器學習自動化一部分審計工做,但遇到的最大困難是我本身對審計的瞭解有限,而其餘審計師對個人工做不是很是支持致使進展緩慢。因此若是你有足夠的機器學習知識,並對特定領域有良好的理解,在職場供求中你確定能夠站在優點的那一邊。以個人另外一個回答爲例「反欺詐(Fraud Detection)中所用到的機器學習模型有哪些?」,特定領域的知識幫助咱們更好的解釋機器學習模型的結果,獲得老闆和客戶的承認,這纔是算法落了地。能寫代碼、構建模型的人千千萬,但理解本身在作什麼,並從中結合本身的領域知識提供商業價值的人少之又少。因此調侃一句,哪一個方向的機器學習人才最緊缺?答:每一個領域都須要專精的機器學習人才,你對特定領域的理解就是你的武器。dom

  固然,給餵雞湯不給勺很不厚道,因此我也會給出一些具體建議。再次申明,個人建議僅給以就業爲目的的朋友,走研究路線我有不一樣的建議,本文再也不贅述。機器學習

  1. 基本功函數

  說到底機器學習仍是須要必定的專業知識,這能夠經過學校學習或者自學完成。但有沒有必要通曉數學,擅長優化呢?個人見解是不須要的,大前提是須要了解基本的數學統計知識便可,更多的討論能夠看我這個答案「阿薩姆:如何看待「機器學習不須要數學,不少算法封裝好了,調個包就行」這種說法?」。最低程度下我建議掌握五個小方向,對於如今和將來幾年內的工業界夠用了。再一次重申,我對於算法的見解是大部分人不要造輪子,不要造輪子,不要造輪子!只要理解本身在作什麼,知道選擇什麼模型,直接調用API和現成的工具包就行了。工具

  迴歸模型(Regression)。學校的課程中其實講得更多的都是分類,但事實上回歸纔是工業屆最多見的模型。好比產品訂價或者預測產品的銷量都須要迴歸模型。現階段比較流行的迴歸方法是以數爲模型的xgboost,預測效果很好還能夠對變量重要性進行自動排序。而傳統的線性迴歸(一元和多元)也還會繼續流行下去,由於其良好的可解釋性和低運算成本。如何掌握迴歸模型?建議閱讀Introduction to Statistical Learning的2-7章,並看一下R裏面的xgboost的package介紹。學習

  分類模型(Classification)。這個屬於老生常談了,但應該對如今流行並將繼續流行下去的模型有深入的瞭解。舉例,隨機森林(Random Forests)和支持向量機(SVM)都還屬於如今經常使用於工業界的算法。可能不少人想不到的是,邏輯迴歸(Logistic Regression)這個常見於大街小巷每一本教科書的經典老算法依然佔據了工業界大半壁江山。這個部分推薦看李航《統計學習方法》,挑着看相對應的那幾章便可。大數據

  神經網絡(Neural Networks)。我沒有把神經網絡歸結到分類算法仍是由於如今太火了,有必要學習瞭解一下。隨着硬件能力的持續增加和數據集愈發豐富,神經網絡的在中小企業的發揮之處確定會有。三五年內,這個可能會發生。但有人會問了,神經網絡包含內容那麼豐富,好比結構,好比正則化,好比權重初始化技巧和激活函數選擇,咱們該學到什麼程度呢?個人建議仍是抓住經典,掌握基本的三套網絡: a. 普通的ANN b. 處理圖像的CNN c. 處理文字和語音的RNN(LSTM)。對於每一個基本的網絡只要瞭解經典的處理方式便可,具體能夠參考《深度學習》的6-10章和吳恩達的Deep Learning網課(已經在網易雲課堂上線)。

  數據壓縮/可視化(Data Compression & Visualization)。在工業界常見的就是先對數據進行可視化,好比這兩年很火的流形學習(manifold learning)就和可視化有很大的關係。工業界認爲作可視化是磨刀不誤砍柴工,把高維數據壓縮到2維或者3維能夠很快看到一些有意思的事情,可能能節省大量的時間。學習可視化可使用現成的工具,如Qlik Sense和Tableau,也可使用Python的Sklearn和Matplotlib。

  無監督學習和半監督學習(Unsupervised & Semi-supervised Learning)。工業界的另外一個特色就是大量的數據缺失,大部分狀況都沒有標籤。以最多見的反詐騙爲例,有標籤的數據很是少。因此咱們通常都須要使用大量的無監督,或者半監督學習來利用有限的標籤進行學習。多說一句,強化學習在大部分企業的使用基本等於0,估計在將來的很長一陣子可能都不會有特別普遍的應用。

  2. 祕密武器

  有了基本功只能說明你能夠輸出了,怎麼才能使得你的基本功不是屠龍之術?必需要結合領域知識,這也是爲何我一直勸不少朋友不要盲目起色器學習從零作起。而學生朋友們能夠更多的關注本身感興趣的領域,思考如何能夠把機器學習運用於這個領域。好比我本身對歷史和哲學很感興趣,經常在思考機器學習和其餘文科領域之間的聯繫,也寫過一些開腦洞的文章「 帶你瞭解機器學習(一): 機器學習中的「哲學」」。

  而已經有了工做/研究經驗的朋友,要試着將本身的工做經歷利用起來。舉例,不要作機器學習裏面最擅長投資的人,而要作金融領域中最擅長機器學習的專家,這纔是你的價值主張(value proposition)。最重要的是,機器學習的基本功沒有你們想的那麼遙不可及,沒有必要放棄本身的本專業全職轉行,沉沒成本過高。經過跨領域徹底能夠作到曲線救國,化劣勢爲優點,大家可能比只懂機器學習的人有更大的行業價值。

  舉幾個我身邊的例子,個人一個朋友是作傳統軟件工程研究的,前年他和我商量如何使用機器學習以GitHub上的commit歷史來識別bug,這就是一個很好的結合領域的知識。若是你自己是作金融出身,在你補足上面基本功的同時,就能夠把機器學習交叉運用於你本身擅長的領域,作策略研究,我已經據說了無數個「宣稱」使用機器學習實現了交易策略案例。雖不可盡信,但對特定領域的深入理解每每就是捅破窗戶的那最後一層紙,只理解模型但不瞭解數據和數據背後的意義,致使不少機器學習模型只停留在好看而不實用的階段。

  換個角度思考,不一樣領域的人都有了對機器學習的理解能更好的促進這個技術落地,打破泡沫的傳言。而對於你們而言,不用再擔憂本身會失業,還能找到本身的角度在這個全民深度學習的時代找到「金飯碗」。因此我建議各行各業的從業者沒必要盲目的轉計算機或者機器學習,而應該加深對本專業的瞭解並自學補充上面提到的基本功,本身成爲這個領域的機器學習專家。

  3. 彈藥補給  大連正規婦科醫院 mobile.62671288.com

  沒有什麼不會改變,這個時代的科技迭代速度很快。從深度學習開始發力到如今也不太短短十年,因此沒有人知道下一個會火的是什麼?以深度學習爲例,這兩年很是火的對抗生成網絡(GAN),多目標學習(multi-lable learning),遷移學習(transfer learning)都還在飛速的發展。有關於深度學習爲何有良好泛化能力的理論猜測文章在最新的NIPS據說也錄了好幾篇。這都說明了沒有什麼行業能夠靠吃老本一直瀟灑下去,咱們還須要追新的熱點。但機器學習的範圍和領域真的很廣,上面所說的都仍是有監督的深度學習,無監督的神經網絡和深度強化學習也是如今火熱的研究領域。因此個人建議是儘可能關注、學習瞭解已經成熟和已經有實例的新熱點,不要凡熱點必追。

  若是你有這些基本功和良好的領域結合能力,三年五年毫不是職業的瓶頸期,甚至十年都還太早。科技時代雖然給了咱們很大的變革壓力,但也帶給了咱們無限的可能。技術總會過期,熱點總會過去,但不會過去的是咱們不斷追求新科技的熱情和對本身的挑戰。

相關文章
相關標籤/搜索