從零使用強化學習訓練AI玩兒遊戲(3)——使用Q-learning

        本文目前主要是寫給本身的一個筆記,接下來這段時間會逐步記錄我是怎麼經過學習使用TensorFlow+Keras訓練神經網絡本身玩兒遊戲,若是能間接幫助到他人就最好不過了,不喜勿噴。html         上一篇咱們已經找到了須要輸入神經網絡的數據(也就是observation 是GYM提供的表明必定意義的數,每一個遊戲不一樣),和神經網絡須要輸出的值(也就是action 須要控制
相關文章
相關標籤/搜索