深入淺出Alpha Zero技術原理

深入淺出Alpha Zero技術原理 1、蒙特卡洛樹搜索 (1)蒙特卡洛方法 蒙特卡羅法也稱統法模擬法、統計試驗法。是把概率現象作爲研究對象的數值模擬方法。 上圖中,求中間曲線區域的面積。曲線區域的面積不易計算,而正方形面積易於計算。則可以進行隨機地採樣,將屬於曲線內的點的數量記作 N a N_{a} Na​,一共採樣了N次。 則中間曲線區域的面積爲: S = S s q u a r e N a
相關文章
相關標籤/搜索