強化學習的天然環境基準

 2020-05-11 05:09:10算法   做者 | wang王編輯 | 叢末框架 雖然當前的基準強化學習(RL)任務對於推進這一領域的進展大有裨益,但在許多方面還不能很好地替代真實數據的學習。在低複雜度的仿真環境中測試日益複雜的RL算法,得到的RL策略難以推廣。ide 論文地址:https://arxiv.org/pdf/1811.06032.pdf函數 爲解決此問題,本文提出了3個新的基
相關文章
相關標籤/搜索