強化學習筆記之淺談ACKTR

  https://zhuanlan.zhihu.com/p/122997370 2017年NIPS上的文章"Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation"提出了一種 Actor Critic using Kronecker-Factored T
相關文章
相關標籤/搜索