DeepMind Nature論文解密,沒有人類的圍棋世界

點擊上方「中興開發者社區」,關注我們 每天讀一篇一線開發者原創好文 文/聞菲 劉小芹 編譯  新智元報道  來源:Nature;DeepMind    DeepMind 如約公佈了他們最新版AlphaGo論文,也是他們最新的Nature論文,介紹了迄今最強最新的版本AlphaGo Zero,使用純強化學習,將價值網絡和策略網絡整合爲一個架構,3天訓練後就以100比0擊敗了上一版本的AlphaGo。
相關文章
相關標籤/搜索