論文筆記之：Asynchronous Methods for Deep Reinforcement Learning

時間 2020-12-24

原文原文鏈接

　　 Asynchronous Methods for Deep Reinforcement Learning ICML 2016 　　深度強化學習最近被人發現貌似不太穩定，有人提出很多改善的方法，這些方法有很多共同的 idea：一個 online 的 agent 碰到的觀察到的數據序列是非靜態的，然後就是，online的 RL 更新是強烈相關的。通過將 agent 的數據存儲在一個 expe

>>阅读原文<<