從零使用強化學習訓練AI玩兒遊戲(3)——使用Q-learning

時間 2021-01-13

原文原文鏈接

本文目前主要是寫給自己的一個筆記，接下來這段時間會逐步記錄我是怎麼通過學習使用TensorFlow+Keras訓練神經網絡自己玩兒遊戲，如果能間接幫助到他人就最好不過了，不喜勿噴。上一篇我們已經找到了需要輸入神經網絡的數據（也就是observation 是GYM提供的代表一定意義的數，每個遊戲不同），和神經網絡需要輸出的值（也就是action 需要控制遊戲的值）

>>阅读原文<<