【深度強化學習】7. 稀疏獎勵和模仿學習

時間 2021-06-19

標籤深度強化學習入門深度學習自動駕駛強化學習简体版

原文原文鏈接

【DataWhale打卡】李宏毅老師視頻中的最後兩部分，sparse reward和imitation learning。文章目錄 1. Sparse Reward 1.1 Reward Shaping 1.2 Curriculum Learning 1.3 Hierarchical RL 2. Imitation Learning 2.1 Behavior Cloning 2.2 Invers

>>阅读原文<<

相關文章

相關標籤/搜索

強化學習篇

深度學習 CNN

Python深度學習

Python 深度學習

深度學習篇

Pytorch 深度學習

深度學習——BNN

XLink 和 XPointer 教程

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<