論文筆記之:Asynchronous Methods for Deep Reinforcement Learning

   Asynchronous Methods for Deep Reinforcement Learning ICML 2016     深度強化學習最近被人發現貌似不太穩定,有人提出很多改善的方法,這些方法有很多共同的 idea:一個 online 的 agent 碰到的觀察到的數據序列是非靜態的,然後就是,online的 RL 更新是強烈相關的。通過將 agent 的數據存儲在一個 expe
相關文章
相關標籤/搜索