Reinforcement learning——an introduction強化學習翻譯1.5節

時間 2021-01-02

標籤強化學習機器學習人工智能简体版

原文原文鏈接

1.5 An Extended Example: Tic-Tac-Toe 爲了說明強化學習的一般思想，並將其與其他方法進行對比，我們接下來考慮一個單獨的例子。以我們熟悉的兒童遊戲井字遊戲爲例。兩個玩家輪流在一塊3乘3的棋盤上玩。一個玩家玩Xs和另一個Os，直到其中一個玩家通過水平、垂直或對角線排列三個標記而獲勝，就像遊戲中X玩家所做的那樣。如果棋盤上沒有一個玩家連續得到3，那麼遊戲就是平

>>阅读原文<<