深度神經進化大有可爲?Uber詳解如何用它優化強化學習 | 5篇論文

本文來自AI新媒體量子位(QbitAI) 在深度學習領域,目前訓練有很多層和數百萬連接的深度神經網絡(DNN)的常規方法,是隨機梯度下降(SGD)。很多人認爲,SGD有效計算梯度的能力至關重要。 然而,我們要發佈5篇系列論文,支持一種正在興起的認識:通過用進化算法來優化神經網絡的神經進化(neuroevolution)也是爲強化學習(RL)訓練深度神經網絡的一種有效方法。 遺傳算法是訓練深度神經網
相關文章
相關標籤/搜索