【李宏毅2020 ML/DL】P110-111 Policy Gradient & Proximal Policy Optimization

時間 2021-01-02

標籤李宏毅深度學習強化學習 DRL TRPO PPO 简体版

原文原文鏈接

我已經有兩年 ML 經歷，這系列課主要用來查缺補漏，會記錄一些細節的、自己不知道的東西。關於強化學習，我專門花半年時間學習實踐過，因此這裏筆記只記錄李老師的 outline 。我的強化學習資源倉庫： https://github.com/PiperLiu/Reinforcement-Learning-practice-zh 我的 CSDN 強化學習博客集合： https://blog.csdn.

>>阅读原文<<

1. 2020李宏毅學習筆記——66 RL Advanced Version 2.Proximal Policy Optimization
2. 【學習筆記】PPO(Proximal Policy Optimization) - 李宏毅
3. Proximal Policy Optimization (PPO)
4. 3.Proximal Policy Optimization(PPO)+on/off policy
5. 【完結】李宏毅深度強化學習筆記（二）Proximal Policy Optimization (PPO)
6. Proximal Policy Optimization (PPO)詳解
7. 【筆記2-2】李宏毅深度強化學習筆記（二）Proximal Policy Optimization (PPO)
8. 機器學習：李宏毅強化學習筆記（一）Proximal Policy Optimization (PPO)
9. 2020李宏毅學習筆記——65 RL Advanced Version 1.Policy Gradient
10. 【深度強化學習】5. Proximal Policy Optimization
更多相關文章...
• Redis內存回收策略 - Redis教程
• R 數據框 - R 語言教程
• Docker容器實戰(一) - 封神Server端技術
• Docker容器實戰(八) - 漫談 Kubernetes 的本質

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

1. 1.2 Illustrator多文檔的幾種排列方式
2. 5.16--java數據類型轉換及雜記
3. 性能指標
4. （1.2）工廠模式之工廠方法模式
5. Java記錄 -42- Java Collection
6. Java記錄 -42- Java Collection
7. github使用
8. Android學習筆記（五十）：聲明、請求和檢查許可
9. 20180626
10. 服務擴容可能引入的負面問題及解決方法

本站公眾號

歡迎關注本站公眾號,獲取更多信息

1. 2020李宏毅學習筆記——66 RL Advanced Version 2.Proximal Policy Optimization
2. 【學習筆記】PPO(Proximal Policy Optimization) - 李宏毅
3. Proximal Policy Optimization (PPO)
4. 3.Proximal Policy Optimization(PPO)+on/off policy
5. 【完結】李宏毅深度強化學習筆記（二）Proximal Policy Optimization (PPO)
6. Proximal Policy Optimization (PPO)詳解
7. 【筆記2-2】李宏毅深度強化學習筆記（二）Proximal Policy Optimization (PPO)
8. 機器學習：李宏毅強化學習筆記（一）Proximal Policy Optimization (PPO)
9. 2020李宏毅學習筆記——65 RL Advanced Version 1.Policy Gradient
10. 【深度強化學習】5. Proximal Policy Optimization

>>更多相關文章<<