DeepMind Nature論文解密，沒有人類的圍棋世界

時間 2021-01-06

原文原文鏈接

點擊上方「中興開發者社區」，關注我們每天讀一篇一線開發者原創好文文/聞菲劉小芹編譯新智元報道來源：Nature；DeepMind 　　DeepMind 如約公佈了他們最新版AlphaGo論文，也是他們最新的Nature論文，介紹了迄今最強最新的版本AlphaGo Zero，使用純強化學習，將價值網絡和策略網絡整合爲一個架構，3天訓練後就以100比0擊敗了上一版本的AlphaGo。

>>阅读原文<<