深度強化學習——Dueling-DDQN

http://www.javashuo.com/article/p-gjdrvhaf-nn.html 深度雙Q網絡(DDQN)和基於競爭構架Q網絡(Dueling-DQN)都是DQN的改進版本,前者是對DQN訓練算法的改進,後者是對DQN模型結構的改進。 一、DDQN 論文(Hasselt等人)發現並證明了傳統的DQN普遍會過高估計Action的Q值,而且估計誤差會隨Action的個數增加而增加。
相關文章
相關標籤/搜索