論文筆記系列-Simple And Efficient Architecture Search For Neural Networks

摘要 本文提出了一種新方法,可以基於簡單的爬山過程自動搜索性能良好的CNN架構,該算法運算符應用網絡態射,然後通過餘弦退火進行短期優化運行。 令人驚訝的是,這種簡單的方法產生了有競爭力的結果,儘管只需要與訓練單個網絡相同數量級的資源。例如使用該算法,在單個GPU上訓練12個小時就可以將CIFAR-10數據集的錯誤率降低到6%一下,訓練一整天后能夠降低到5%左右。 1.介紹 背景不再詳述,我們可以知
相關文章
相關標籤/搜索