一文讀懂深度強化學習算法 A3C （Actor-Critic Algorithm）

時間 2021-01-02

原文原文鏈接

一文讀懂深度強化學習算法 A3C （Actor-Critic Algorithm）　　對於 A3C 算法感覺自己總是一知半解，現將其梳理一下，記錄在此，也給想學習的小夥伴一個參考。　　想要認識清楚這個算法，需要對 DRL 的算法有比較深刻的瞭解，推薦大家先了解下 Deep Q-learning 和 Policy Gradient 算法。　　我們知道，DRL 算法大致可以分爲如下這幾個類

>>阅读原文<<