28 天自制你的 AlphaGo(五):蒙特卡洛樹搜索(MCTS)基礎

蒙特卡洛樹搜索(MCTS)是所有現代圍棋程序的核心組件。在此之上可以加入各種小技巧(如 UCT,RAVE/AMAF,Progressive Bias,Virtual win & lose,Progressive Widening,LGR,Criticality 等等)和大改進(如 AlphaGo 的策略網絡和價值網絡)。 網上很少見到關於 MCTS 的詳細介紹,而且許多看似詳細的介紹實際有錯誤,甚
相關文章
相關標籤/搜索