強化學習的自然環境基準

 2020-05-11 05:09:10   作者 | wang王編輯 | 叢末 雖然當前的基準強化學習(RL)任務對於推動這一領域的進展大有裨益,但在許多方面還不能很好地替代真實數據的學習。在低複雜度的仿真環境中測試日益複雜的RL算法,獲得的RL策略難以推廣。 論文地址:https://arxiv.org/pdf/1811.06032.pdf 爲解決此問題,本文提出了3個新的基準RL域體系,包含
相關文章
相關標籤/搜索