Paper-2 精讀GPS (2014 NIPS)

Guided Policy Search 概述 一、 GPS的基礎知識 1.1 MBRL的Model已知 1.1.1 確定的dynamics model 1.1.2 隨機的dynamics model 1.2 學習Model 1.3 Unknown Dynamics 1.3.1 Run the controller (policy) 1.3.2 Fitting dynamics 1.3.3 Imp
相關文章
相關標籤/搜索