強化學習極簡例子--井字棋

井字棋 3*3的棋盤上,白、黑子輪流下。如果某方棋子佔滿同一行、同一列、同一條斜線,則算贏。當棋盤佔滿還未分出勝負,則爲和棋。 棋局狀態編碼 由於每個位置有三種可能狀態:空(0)、白(1)、黑(2),可用3進制來表示棋局當前狀態,其中0行0列表示最低位,0行1列表示次低位。 圖1. 棋局例 圖1所示棋局,用3進製表示爲001200210,轉化爲十進制即 0 × 3 8 + 0 × 3 7 + 1
相關文章
相關標籤/搜索