【5分鐘 Paper】(TD3) Addressing Function Approximation Error in Actor-Critic Methods

時間 2021-01-08

原文原文鏈接

論文題目：Addressing Function Approximation Error in Actor-Critic Methods 所解決的問題？ value-base的強化學習值函數的近似估計會過估計值函數(DQN)，作者將Double Q-Learning處理過擬合的思想引入actor critic算法中。(過估計的問題就在於累計誤差會使得某些不好的state的value變地很高(e

>>阅读原文<<