蒙特卡洛樹搜索實現井字棋

蒙特卡洛算法 例子 井字棋實現 1)以當前局面創建根節點 2)棋面剩餘位置爲子節點 3)因每個子節點訪問爲0,所以循環模擬每個子節點,然後反向傳播,下一步在從根節點根據UCB進行選擇,擴展,模擬,反向傳播,直到訓練結束 4)從當前棋面下用UCB選擇下一步棋面進行落子 5)然後重複step1,step2,step3,step4直到遊戲結束
相關文章
相關標籤/搜索