強化學習論文(1): Soft Actor-Critic

時間 2020-12-30

原文原文鏈接

加州伯克利大學發佈的 off-policy model-free強化學習算法，soft actor-critic（SAC）論文地址爲：Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor 假定已經對經典強化學習建模和基本Actor-Critic方法有所瞭解

>>阅读原文<<