UCT(信心上限樹算法)解四子棋問題——蒙特卡羅法模擬人機博弈

說蒙特卡羅規劃方法的思想挺簡潔的,但我在理解它的實現過程時我仍是費了些功夫。這裏主要以簡單的四子棋爲例描述一下蒙特卡羅方法是如何解決人機博弈這一類問題的。算法   UCT算法是蒙特卡羅規劃方法的改進,是將UCB1算法(信心上限算法)思想用於蒙特卡羅規劃的特定算法,它比單純的蒙特卡羅規劃更容易得到最優解。首先貼一段僞代碼:函數 這段僞代碼來自於一本我也不知道名字的書的第八章——蒙特卡羅博弈方法。首先
相關文章
相關標籤/搜索