深度強化學習——Dueling-DDQN

時間 2021-01-01

原文原文鏈接

http://www.javashuo.com/article/p-gjdrvhaf-nn.html 深度雙Q網絡（DDQN）和基於競爭構架Q網絡（Dueling-DQN）都是DQN的改進版本，前者是對DQN訓練算法的改進，後者是對DQN模型結構的改進。一、DDQN 論文（Hasselt等人）發現並證明了傳統的DQN普遍會過高估計Action的Q值，而且估計誤差會隨Action的個數增加而增加。

>>阅读原文<<