2020-10-12討論報告

1. 關於Alpha zero AlphaZero是谷歌下屬公司Deepmind的新版程序。從空白狀態學起,在無任何人類輸入的條件下,AlphaZero能夠迅速自學圍棋,並以100:0的戰績擊敗「前輩」。 AlphaZero的工作方式:使用MCTS預測搜索,並通過神經網絡智能引導。 下面將對AlphaZero使用的這兩個模型進行描述。 2. MCTS蒙特卡洛搜索樹 2.1 總體介紹 蒙特卡洛樹搜索
相關文章
相關標籤/搜索