RL論文閱讀6 - MB-MPO2018

文章目錄 Tittle 標籤 總結 針對問題: 解決思路 原理 1. 前序工作簡介:Meta-Learning for RL **2. MPO原理** (1)模型學習: (2)Meta-RL 應用在學習的模型上 3. 算法 Tittle source 標籤 Meta-learning Model-based 總結 針對問題: data inefficient MB算法過於依賴模型的準確率,如果模型
相關文章
相關標籤/搜索