Keras強化學習練手——FlappyBird

時間 2021-01-18

標籤 Python 欄目遊戲简体版

原文原文鏈接

Document keras強化學習——FlappyBird 運行過程 main.py中train()函數定義好網絡和回調函數。變量參數網絡 net 預測函數 func = Model(net.input[0], net.out1) 強化學習有5個元素：環境，代理，狀態，激勵函數(reward)，動作。代理產生動作，環境根據動作反饋該動作之後的環境狀態以及reward。需要注意該State

>>阅读原文<<