蒙特卡洛樹搜索

蒙特卡洛樹搜索的基本概念 蒙特卡洛樹搜索會屢次模擬博弈,並嘗試根據模擬結果預測最優的移動方案。蒙特卡洛樹搜索的主要概念是搜索,即沿着博弈樹向下的一組遍歷過程。單次遍歷的路徑會從根節點(當前博弈狀態)延伸到沒有徹底展開的節點,未徹底展開的節點表示其子節點至少有一個未訪問到。遇到未徹底展開的節點時,它的一個未訪問子節點將會做爲單次模擬的根節點,隨後模擬的結果將會反向傳播回當前樹的根節點並更新博弈樹的節
相關文章
相關標籤/搜索