強化學習新路徑:基於自監督預測的好奇心驅動探索(Paper+Code)

本文來自AI新媒體量子位(QbitAI) 最近,來自加州大學伯克利分校的Deepak Pathak、Pulkit Agrawal、Alexei A. Efros等人寫了一篇題爲「基於自監督預測的好奇心驅動探索」的論文,這篇文章提出了一種內在好奇心單元(Intrinsic Curiosity Module),來幫助操作者探索新環境。 論文被收錄於8月11號在悉尼舉辦的ICML 2017上,以下是論文
相關文章
相關標籤/搜索