強化學習—DQN訓練計算機玩Flappy Bird遊戲

時間 2020-07-20

原文原文鏈接

文章目錄 1 Flappy Bird遊戲簡述 2 Q-Learning簡述 3 Deep Q Network(DQN) 3.1 爲何要用DQN 3.2 DQN中的幾個巧妙的地方 3.2.1 experience replay（經驗池、記憶庫） 3.2.2 使用Q-target網絡來更新Q網絡 3.3 DQN實現細節 3.3.1 神經網絡結構 3.3.2 代碼實現的細節 4 問題 5 代碼註釋 1

>>阅读原文<<