RL論文閱讀【四】Deep Reinforcement Learning with Double Q-learning（Double DQN）

時間 2020-12-29

原文原文鏈接

1 廢話今天特地早回來了點，天天一點睡，熬不住啊。把 Double DQN 看完了，收穫還是不小的吧，雖然公式早就知道，不過把爲什麼DQN會高估和怎麼解決的思路介紹的比較清楚了。 2 Motivation 其實吧，DQN 存在的高估問題和 Q-learning 是一樣的，所以 Q-learning 是如何解決的呢？答案就是 Double Q-learning，所以我們今天的 Double DQN

>>阅读原文<<