【5分鐘 Paper】(TD3) Addressing Function Approximation Error in Actor-Critic Methods

論文題目:Addressing Function Approximation Error in Actor-Critic Methods 所解決的問題?   value-base的強化學習值函數的近似估計會過估計值函數(DQN),作者將Double Q-Learning處理過擬合的思想引入actor critic算法中。(過估計的問題就在於累計誤差會使得某些不好的state的value變地很高(e
相關文章
相關標籤/搜索