Learning to Design Games Strategic Environments in Reinforcement Learning(部分翻譯)

摘要算法 在典型的強化學習(reinforcement learning ,RL)中,(一般是)假設環境給定,而且學習的目標是爲代理agent經過與環境的交互採起行動肯定最優策略。在本篇論文中,咱們拓展這種設置,經過考慮環境未給定,但倒是可控的以及可學習的(只要)經過它與代理agent的實時交互。這個擴展是受現實世界中的環境設計場景的啓發,包括遊戲設計、購物空間設計和交通訊號燈設計。理論上來講,咱
相關文章
相關標籤/搜索