【李宏毅2020 ML/DL】P115-117 Actor-Critic & Sparse Reward & Imitation Learning

時間 2021-01-02

原文原文鏈接

我已經有兩年 ML 經歷，這系列課主要用來查缺補漏，會記錄一些細節的、自己不知道的東西。關於強化學習，我專門花半年時間學習實踐過，因此這裏筆記只記錄李老師的 outline 。我的強化學習資源倉庫： https://github.com/PiperLiu/Reinforcement-Learning-practice-zh 我的 CSDN 強化學習博客集合： https://blog.csdn.