強化學習論文筆記:Soft Actor Critic算法

Soft Actor Critic是伯克利大學團隊在2018年的ICML(International Conference on Machine Learning)上發表的off-policy model-free強化學習算法 論文地址爲:Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a
相關文章
相關標籤/搜索