【NIPS 2018】循環World模型促進策略演變

論文題目:Recurrent World Models Facilitate Policy Evolution 所解決的問題? 從world model中學一個policy,並將遷移到real world。 背景 人類通常是通過自己的感官數據建立自己對這個世界的認知模型。比如看同一張圖片,不同的人能夠得到不同的抽象理解,而這個理解跟他自己之前建立的世界觀存在相關性。這種對世界的認知能夠幫助我們,遇
相關文章
相關標籤/搜索