Lee Hung-yi強化學習 | (8) Imitation Learning

時間 2021-01-02

標籤 Lee Hung-yi強化學習简体版

原文原文鏈接

Lee Hung-yi強化學習專欄系列博客主要轉載自CSDN博主 qqqeeevvv，原專欄地址課程視頻課件地址上一篇筆記講了reward很稀疏的情況，但是在實際中，可能問題還會更進一步：很多場景是很難有一個明確的reward甚至沒有reward。所以需要很厲害的agent或者直接由人來示範的資料/數據，讓agent跟着做。本文會講兩個Imitation Learning的方法： 1）Be

>>阅读原文<<