無先驗從零開始深度學習AlphaGo zero

淺讀AlphaGo zero 這兩天花點時間看了發表在《Nature》上的Mastering the Game of Go without Human Knowledge這篇文章,文章號稱可以無人類先驗知識,僅使用圍棋的自身規則進行學習、自助調參,使用一個網絡完成訓練。然後就可以進行下棋,併成功打敗他的哥哥AlphaGo Lee和AlphaGo Fan. 相關數據: 訓練了3天,進行了4.9百萬次
相關文章
相關標籤/搜索