用一個小遊戲入門深度強化學習

今天我們來用深度強化學習算法 deep Q-learning 玩 CartPole 遊戲。 強化學習是機器學習的一個重要分支,通過強化學習我們可以創建一個 agent,讓它與環境不斷地互動,不斷試錯,自主地從中學習到知識,進而做出決策。 如圖所示,agent 收到環境的狀態 state,做出行動 action,行動後會得到一個反饋,反饋包括獎勵 reward 和環境的下一個狀態 next_stat
相關文章
相關標籤/搜索