強化學習入門（三）將神經網絡引入強化學習，經典算法 DQN

時間 2020-12-24

標籤強化學習神經網絡人工智能百度简体版

原文原文鏈接

本文內容源自百度強化學習 7 日入門課程學習整理感謝百度 PARL 團隊李科澆老師的課程講解文章目錄一、爲什麼要引入神經網絡二、DQN 算法 2.1 DQN 約等於 Q-learning + 神經網絡 2.2 DQN 的兩大創新 2.2.1 經驗回放 Experience replay 2.2.2 固定 Q 目標 Fixed Q target 2.3 DQN 流程框架圖 2.4 PARL

>>阅读原文<<