【深度】專業解讀「深度強化學習「：從AlphaGo到AlphaGoZero

時間 2020-07-25

標籤深度專業解讀強化學習 alphago alphagozero 简体版

原文原文鏈接

近日，DeepMind在Nature上公佈了最新版AlphaGo論文，介紹了迄今爲止最強的圍棋AI:AlphaGoZero。AlphaGoZero不須要人類專家知識，只使用純粹的深度強化學習技術和蒙特卡羅樹搜索，通過3天自我對弈以100：0擊敗上一版本AlphaGo。AlphaGoZero證實了深度強化學習的強大能力，這一成果也勢必將推進該領域的進一步發展。算法深度強化學習和AlphaGo網絡

>>阅读原文<<