直播實錄 | AlphaGo Zero是如何實現無師自通的？

時間 2021-01-06

原文原文鏈接

本文爲 10 月 29 日，聖何塞州立大學——劉遙行的論文共讀直播分享實錄。 Google DeepMind 團隊在 Nature 上發表的最新論文，闡述了新版 AlphaGo 是如何從空白狀態學起，不使用任何人類棋譜，通過自對弈強化學習，僅用 3 天訓練時間就以 100:0 擊敗了上一版本的 AlphaGo，並用 21 天達到 AlphaGo Master 水平。 AlphaGo Zero 的核

>>阅读原文<<