加強學習系列之(二):實現一個簡單的加強學習的例子

咱們如今來用以前提到的Q-Learning算法,實現一個有趣的東西python 1. 算法效果 咱們想要實現的,就是一個這樣的小車。小車有兩個動做,在任何一個時刻能夠向左運動,也能夠向右運動,咱們的目標是上小車走上山頂。一開始小車只能隨機地左右運動,在訓練了一段時間以後就能夠很好地完成咱們設定的目標了 web 2. Deep Q Learning 算法簡單介紹 就像咱們在前一章裏面簡單介紹的,咱們
相關文章
相關標籤/搜索