構建一個典型的機器學習項目,通常分紅如下步驟:架構
收集原始數據、合併數據源、清洗數據、特徵工程、模型構建、超參數調優、模型驗證和設備部署。框架
整個過程當中,模型構建最能體現創造力,而最耗時的,要數特徵工程和超參數調優。機器學習
因而,有時候會由於趕時間,過早將模型從實驗階段轉移到生產階段,致使它們發揮不出最佳效果;也有時候,會由於花了太多時間調優致使部署延遲。性能
這時候,就體現出了自動機器學習(Automatic machine learning, AML)框架的價值。學習
自動機器學習框架能幫助數據科學家減輕負擔,下降特徵工程和超參數調優的工做量,讓他們能花更多時間來嘗試模型架構。快速驗證可能的方案不只能讓數據科學家很快地評估目標數據集,也能提供基準性能用以改進。部署
本文儘量全面地介紹現有的自動機器學習框架,也附上了對應的代碼地址。數據