強化學習新路徑：基於自監督預測的好奇心驅動探索(Paper+Code)

時間 2021-07-13

原文原文鏈接

本文來自AI新媒體量子位（QbitAI）最近，來自加州大學伯克利分校的Deepak Pathak、Pulkit Agrawal、Alexei A. Efros等人寫了一篇題爲「基於自監督預測的好奇心驅動探索」的論文，這篇文章提出了一種內在好奇心單元（Intrinsic Curiosity Module），來幫助操作者探索新環境。論文被收錄於8月11號在悉尼舉辦的ICML 2017上，以下是論文

>>阅读原文<<