強化學習的天然環境基準

時間 2020-05-12

標籤強化學習天然環境基準简体版

原文原文鏈接

2020-05-11 05:09:10算法做者 | wang王編輯 | 叢末框架雖然當前的基準強化學習（RL）任務對於推進這一領域的進展大有裨益，但在許多方面還不能很好地替代真實數據的學習。在低複雜度的仿真環境中測試日益複雜的RL算法，得到的RL策略難以推廣。ide 論文地址：https://arxiv.org/pdf/1811.06032.pdf函數爲解決此問題，本文提出了3個新的基

>>阅读原文<<