這篇文章是系列文章的第1部分,第2部分將闡述AutoML和神經架構搜索、第3部分將特別地介紹Google的AutoML。架構
關於機器學習人才的稀缺和公司聲稱他們的產品可以自動化機器學習並且能徹底消除對ML專業知識需求的承諾常常登上媒體的新聞頭條。在TensorFlow DevSummit的主題演講中,Google的AI總指揮Jeff Dean估計,有數千萬擁有可用於機器學習的數據而缺少必要的專業知識和技能的組織。由於我在fast.ai主要專一於讓更多的人去使用機器學習而且讓它更容易使用,因此我密切關注剛纔所提的機器學習人才稀缺等問題。機器學習
在考慮如何使機器學習的一些工做自動化以及讓具備更普遍背景的人更容易使用這項技術,首先有必要問的是:機器學習行業從業者到底在作什麼?任何用來解決機器學習專業知識稀缺的方案都須要回答這個問題:咱們是否知道去教什麼技能、去創建什麼工具或者去自動化什麼工序。工具
從事機器學習行業的人作什麼?學習
構建數據產品是一項複雜的工做spa
雖然許多關於機器學習的學術來源幾乎都是預測建模,但這只是從事機器學習在正常狀況下作的其中一件事。適當地分析商業問題,收集和清理數據,構建模型,實施結果,而後監控變化的過程在不少方式中是相互關聯的,這每每很難僅僅經過單個部分進行孤立(至少不知道其餘部分須要什麼)。正如Jeremy Howard等人在《設計出色的數據產品》上寫道:偉大的預測建模是解決方案的重要組成部分,但它再也不獨立;隨着產品變得愈來愈複雜,它就會消失在管道中。設計
構建數據產品是一項複雜的工做blog