論文筆記 Benchmarking Model-Based Reinforcement Learning

摘要 Model-based強化學習(MBRL)比Model-free強化學習(MFRL)更加sample efficient。目前對於MBRL的研究沒有標準,作者們可能會使用自己設計的環境、一些閉源且不能復現的結果。本文收集了大批MBRL算法,並在18個爲MBRL特別設計的基準環境上按照統一的設置運行。本文還描述了三個未來MBRL研究的關鍵挑戰:動力瓶頸、規劃週期困境、提前終止困境、   介紹
相關文章
相關標籤/搜索