伯克利新研究:讓深度強化學習不再一條道走到黑 | Paper+Code

本文來自AI新媒體量子位(QbitAI) 來自加州大學伯克利分校的博士生唐浩然(Haoran Tang)和Tuomas Haarnoja今天發表博客文章,介紹了他們的一項新研究。原標題《通過最大熵深度強化學習掌握不同的技能》,以下是文章的主要內容。 標準的深度強化學習,旨在掌握單一方法來解決給定的任務。但只有一種解決方案是不夠的,因爲智能體很容易受到現實世界中常見環境變化的影響。 例如,一個在簡單
相關文章
相關標籤/搜索