深度強化學習實戰:Tensorflow實現DDPG - PaperWeekly 第48期

作者丨李國豪 學校丨中國科學院大學&上海科技大學 研究方向丨無人駕駛,強化學習 指導老師丨林寶軍教授 1. 前言 本文主要講解 DeepMind 發佈在 ICLR 2016 的文章 Continuous control with deep reinforcement learning,時間稍微有點久遠,但因爲算法經典,還是值得去實現。 2. 環境 這次實驗環境是 Openai Gym 的 Pend
相關文章
相關標籤/搜索