強化學習—DQN訓練計算機玩Flappy Bird遊戲

文章目錄 1 Flappy Bird遊戲簡述 2 Q-Learning簡述 3 Deep Q Network(DQN) 3.1 爲何要用DQN 3.2 DQN中的幾個巧妙的地方 3.2.1 experience replay(經驗池、記憶庫) 3.2.2 使用Q-target網絡來更新Q網絡 3.3 DQN實現細節 3.3.1 神經網絡結構 3.3.2 代碼實現的細節 4 問題 5 代碼註釋 1
相關文章
相關標籤/搜索