李宏毅深度強化學習筆記(六)Actor-Critic

參考jessie_weiqing博客:http://www.javashuo.com/article/p-qmhwgtlq-sw.html 李宏毅深度強化學習課程 https://www.bilibili.com/video/av24724071 Asynchronous Advantage Actor-Critic (A3C) 回顧 – Policy Gradient 先對policy grad
相關文章
相關標籤/搜索