【深度強化學習】7. 稀疏獎勵和模仿學習

【DataWhale打卡】李宏毅老師視頻中的最後兩部分,sparse reward和imitation learning。 文章目錄 1. Sparse Reward 1.1 Reward Shaping 1.2 Curriculum Learning 1.3 Hierarchical RL 2. Imitation Learning 2.1 Behavior Cloning 2.2 Invers
相關文章
相關標籤/搜索