經過簡單的強化學習實現井字棋(Tic-Tac-Toe)

1、強化學習簡介 強化學習的過程能夠理解爲Agent與Environment的交互、學習、進步的過程,在井字棋中,能夠簡單的將其中的一方理解爲Agent,另外一方爲Environment。交互的過程當中主要有一下4個要素:python 狀態(state):指可能出現的狀況或局面,在井字棋中指局面上的落子狀況與前後手。 操做(action):指從一個狀態(state)到另外一個狀態(state)的過
相關文章
相關標籤/搜索