用一個小遊戲入門深度強化學習

時間 2021-01-04

原文原文鏈接

今天我們來用深度強化學習算法 deep Q-learning 玩 CartPole 遊戲。強化學習是機器學習的一個重要分支，通過強化學習我們可以創建一個 agent，讓它與環境不斷地互動，不斷試錯，自主地從中學習到知識，進而做出決策。如圖所示，agent 收到環境的狀態 state，做出行動 action，行動後會得到一個反饋，反饋包括獎勵 reward 和環境的下一個狀態 next_stat

>>阅读原文<<