Q-learning through Flappy Bird

學習https://www.zhihu.com/search?type=content&q=Q-learning的筆記  讓小鳥學習怎麼飛是一個強化學習的過程,強化學習中有狀態 動作 獎賞三個要素,智能體根據狀態採取動作,獲得獎賞後再去改進這些動作,使下次再到相同的狀態,智能體能做出更優的動作。 狀態的選擇 小鳥到下一根下側管子的水平距離和垂直距離差 (圖片來自原項目) 動作的選擇 1 向上飛一下
相關文章
相關標籤/搜索