強化學習入門(三)將神經網絡引入強化學習,經典算法 DQN

本文內容源自百度強化學習 7 日入門課程學習整理 感謝百度 PARL 團隊李科澆老師的課程講解 文章目錄 一、爲什麼要引入神經網絡 二、DQN 算法 2.1 DQN 約等於 Q-learning + 神經網絡 2.2 DQN 的兩大創新 2.2.1 經驗回放 Experience replay 2.2.2 固定 Q 目標 Fixed Q target 2.3 DQN 流程框架圖 2.4 PARL
相關文章
相關標籤/搜索