Lee Hung-yi強化學習 | (8) Imitation Learning

Lee Hung-yi強化學習專欄系列博客主要轉載自CSDN博主 qqqeeevvv,原專欄地址 課程視頻 課件地址 上一篇筆記講了reward很稀疏的情況,但是在實際中,可能問題還會更進一步:很多場景是很難有一個明確的reward甚至沒有reward。所以需要很厲害的agent或者直接由人來示範的資料/數據,讓agent跟着做。 本文會講兩個Imitation Learning的方法: 1)Be
相關文章
相關標籤/搜索