基於模型的強化學習比無模型的強化學習更好?錯

作者 | Carles Gelada and Jacob Buckman 編輯 | DeepRL 來源 | 深度強化學習實驗室(ID:Deep-RL) 【導讀】許多研究人員認爲,基於模型的強化學習(MBRL)比無模型的強化學習(MFRL)具有更高的樣本效率。但是,從根本上講,這種說法是錯誤的。更細微的分析表明,使用神經網絡時,MBRL方法可能比MFRL方法具有更高的採樣效率,但僅適用於某些任務。此
相關文章
相關標籤/搜索