RL論文閱讀【四】Deep Reinforcement Learning with Double Q-learning(Double DQN)

1 廢話 今天特地早回來了點,天天一點睡,熬不住啊。把 Double DQN 看完了,收穫還是不小的吧,雖然公式早就知道,不過把爲什麼DQN會高估和怎麼解決的思路介紹的比較清楚了。 2 Motivation 其實吧,DQN 存在的高估問題和 Q-learning 是一樣的,所以 Q-learning 是如何解決的呢?答案就是 Double Q-learning,所以我們今天的 Double DQN
相關文章
相關標籤/搜索