強化學習論文(1): Soft Actor-Critic

加州伯克利大學發佈的 off-policy model-free強化學習算法,soft actor-critic(SAC) 論文地址爲:Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor 假定已經對經典強化學習建模和基本Actor-Critic方法有所瞭解
相關文章
相關標籤/搜索