機器學習（三十七）——Integrating Learning and Planning（3）

時間 2021-01-02

原文原文鏈接

Integrating Learning and Planning Monte-Carlo Search（續）下面我們結合實例（下圍棋）和示意圖，來實際瞭解MCTS的運作過程。第一次迭代：五角形表示的狀態是個體第一次訪問的狀態，也是第一次被錄入搜索樹的狀態。我們構建搜索樹：將當前狀態錄入搜索樹中。使用基於蒙特卡羅樹搜索的策略（兩個階段），由於當前搜索樹中只有當前狀態，全程使用的應該是一個搜索第

>>阅读原文<<