Alphago中的蒙特卡洛算法

AlphaGo使用蒙特卡洛樹搜索(Monte Carlo tree search),藉助值網絡(value network)與策略網絡(policy network)這兩種深度神經網絡,通過值網絡來評估大量選點,並通過策略網絡選擇落點。   什麼是 MCTS? 全稱 Monte Carlo Tree Search,是一種人工智能問題中做出最優決策的方法,一般是在組合博弈中的行動(move)規劃形式
相關文章
相關標籤/搜索