RL論文閱讀10-me-RL2.2016

時間 2021-01-12

標籤強化學習RL 人工智能简体版

原文原文鏈接

Tittle source 標籤 Meta-Learning 總結針對的問題 Data efficiency Fast Learn 解決方法把agent的學習過程視爲一個可以使用標準的RL算法優化的objective，agent使用一個RNN網絡來表示，接收past rewards, actions, terminations flags, observations. 它保留着某個MDP過程的

>>阅读原文<<

相關文章

相關標籤/搜索

論文閱讀筆記

Thymeleaf 教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<