煉丹術的終結二——可遷移結構學習

本文首發於我的知乎專欄深度學習與計算機視覺, 歡迎關注,最新內容搶先看。 上一文中介紹瞭如何用控制器(LSTM)搜索CNN網絡和LSTM網絡結構,從而生成出不遜於人類手工設計的網絡結構。方法雖然已經work了,但是由於需要生成的參數很多,導致最後的網絡結構的搜索空間非常的大,以至於非常耗時,在一個小的數據集上仍然需要800個GPU並行運算數天乃至一週之多。爲了解決這個問題,文獻[1]中提出了一種降
相關文章
相關標籤/搜索