Nature DQN與Double DQN

時間 2021-07-12

原文原文鏈接

在前面的文章強化學習DQN算法中，介紹了經典的DQN算法，然而DQN也存在一些問題。Nature DQN與Double DQN的提出就是爲了解決這些問題，下面筆者將介紹這個兩種改進的算法。 Nature DQN算法 Nature DQN的提出是爲了提升原版DQN的收斂速度。在原版DQN中，計算目標Q值的公式如下：由於在計算目標值時，使用的是當前要訓練的網絡，而網絡的更新使用的又是目標

>>阅读原文<<