QUANT[19]強化學習(Reinforcement Learning)學習筆記7

Reinforcement Learning:An Introduction NOTE[5] 1.5 拓展例子:井字棋 爲了說明強化學習的一般概念,並與其他方法進行對比,我們接下來將更詳細地考慮一個示例。 ​ 想想我們熟悉的孩子玩的井字棋。棋手在三行三列的棋盤上博弈,一個棋手下X,另一個下O。若X或O的連續三個棋子落於一行或一列或同一斜線上則獲勝;若棋盤被填滿也不能決出勝負則爲平局。讓我們假設,我
相關文章
相關標籤/搜索