QUANT[19]強化學習(Reinforcement Learning)學習筆記7

時間 2021-01-02

標籤強化學習简体版

原文原文鏈接

Reinforcement Learning：An Introduction NOTE[5] 1.5 拓展例子：井字棋爲了說明強化學習的一般概念，並與其他方法進行對比，我們接下來將更詳細地考慮一個示例。想想我們熟悉的孩子玩的井字棋。棋手在三行三列的棋盤上博弈，一個棋手下X，另一個下O。若X或O的連續三個棋子落於一行或一列或同一斜線上則獲勝；若棋盤被填滿也不能決出勝負則爲平局。讓我們假設，我

>>阅读原文<<