從零使用強化學習訓練AI玩兒遊戲(3)——使用Q-learning

        本文目前主要是寫給自己的一個筆記,接下來這段時間會逐步記錄我是怎麼通過學習使用TensorFlow+Keras訓練神經網絡自己玩兒遊戲,如果能間接幫助到他人就最好不過了,不喜勿噴。         上一篇我們已經找到了需要輸入神經網絡的數據(也就是observation 是GYM提供的代表一定意義的數,每個遊戲不同),和神經網絡需要輸出的值(也就是action 需要控制遊戲的值)
相關文章
相關標籤/搜索