強化學習 7—— 一文讀懂 Deep Q-Learning(DQN)算法

上篇文章強化學習——狀態價值函數逼近介紹了價值函數逼近(Value Function Approximation,VFA)的理論,本篇文章介紹大名鼎鼎的DQN算法。DQN算法是 DeepMind 團隊在2015年提出的算法,對於強化學習訓練苦難問題,其開創性的提出了兩個解決辦法,在atari遊戲上都有不俗的表現。論文發表在了 Nature 上,此後的一些DQN相關算法都是在其基礎上改進,可以說是打
相關文章
相關標籤/搜索