（重磅）深度強化學習的加速方法

時間 2021-01-06

原文原文鏈接

《Accelerated methods for deep reinforcement learning》論文解讀深度強化學習一直以來都以智能體訓練時間長、計算力需求大而限制很多的人去學習，比如：AlphaZero訓練3天的時間等，因此縮短訓練週轉時間成爲一個重要話題。目前這塊的研究成果並不是特別多，但，深度強化學習大神Pieter Abbeel發表了深度強化學習的加速方法，他從整體上提出了一個

>>阅读原文<<