Keras強化學習練手——FlappyBird

Document keras強化學習——FlappyBird 運行過程 main.py中train()函數定義好網絡和回調函數。 變量 參數 網絡 net 預測函數 func = Model(net.input[0], net.out1) 強化學習有5個元素:環境,代理,狀態,激勵函數(reward),動作。 代理產生動作,環境根據動作反饋該動作之後的環境狀態以及reward。需要注意該State
相關文章
相關標籤/搜索