Continuous control with Deep Reinforcement Learning

來源:ICLR2016 作者:Deepmind 創新點:將Deep Q-Learning應用到連續動作領域continuous control(比如機器人控制) 實驗成果:能夠魯棒地解決20個仿真的物理控制任務,包含機器人的操作,運動,開車。。。效果比肩傳統的規劃方法。 優點: End-to-End 將Deep Reinforcement Learning應用在連續動作空間 缺點: 對於3D賽車,
相關文章
相關標籤/搜索