【深度】專業解讀「深度強化學習「:從AlphaGo到AlphaGoZero

近日,DeepMind在Nature上公佈了最新版AlphaGo論文,介紹了迄今爲止最強的圍棋AI:AlphaGoZero。AlphaGoZero不須要人類專家知識,只使用純粹的深度強化學習技術和蒙特卡羅樹搜索,通過3天自我對弈以100:0擊敗上一版本AlphaGo。AlphaGoZero證實了深度強化學習的強大能力,這一成果也勢必將推進該領域的進一步發展。 算法 深度強化學習和AlphaGo網絡
相關文章
相關標籤/搜索