Nature DQN與Double DQN

在前面的文章強化學習DQN算法中,介紹了經典的DQN算法,然而DQN也存在一些問題。Nature DQN與Double DQN的提出就是爲了解決這些問題,下面筆者將介紹這個兩種改進的算法。 Nature DQN算法 Nature DQN的提出是爲了提升原版DQN的收斂速度。在原版DQN中,計算目標Q值的公式 如下: 由於在計算目標 值 時,使用的是當前要訓練的 網絡,而 網絡的更新使用的又是目標
相關文章
相關標籤/搜索