無先驗從零開始深度學習AlphaGo zero

時間 2021-01-18

標籤 Alphago MCTS 简体版

原文原文鏈接

淺讀AlphaGo zero 這兩天花點時間看了發表在《Nature》上的Mastering the Game of Go without Human Knowledge這篇文章，文章號稱可以無人類先驗知識，僅使用圍棋的自身規則進行學習、自助調參，使用一個網絡完成訓練。然後就可以進行下棋，併成功打敗他的哥哥AlphaGo Lee和AlphaGo Fan. 相關數據：訓練了3天，進行了4.9百萬次

>>阅读原文<<