強化學習 7—— 一文讀懂 Deep Q-Learning（DQN）算法

時間 2021-01-02

標籤強化學習神經網絡 DQN 算法简体版

原文原文鏈接

上篇文章強化學習——狀態價值函數逼近介紹了價值函數逼近（Value Function Approximation，VFA）的理論，本篇文章介紹大名鼎鼎的DQN算法。DQN算法是 DeepMind 團隊在2015年提出的算法，對於強化學習訓練苦難問題，其開創性的提出了兩個解決辦法，在atari遊戲上都有不俗的表現。論文發表在了 Nature 上，此後的一些DQN相關算法都是在其基礎上改進，可以說是打

>>阅读原文<<