Reinforcement learning——an introduction強化學習翻譯1.5節

1.5 An Extended Example: Tic-Tac-Toe ​ 爲了說明強化學習的一般思想,並將其與其他方法進行對比,我們接下來考慮一個單獨的例子。 ​ 以我們熟悉的兒童遊戲井字遊戲爲例。兩個玩家輪流在一塊3乘3的棋盤上玩。一個玩家玩Xs和另一個Os,直到其中一個玩家通過水平、垂直或對角線排列三個標記而獲勝,就像遊戲中X玩家所做的那樣。如果棋盤上沒有一個玩家連續得到3,那麼遊戲就是平
相關文章
相關標籤/搜索