【強化學習】AlphaGo Zero論文

時間 2020-12-30

標籤 AlphaGo Zero 強化學習简体版

原文原文鏈接

AlphaGo Zero論文中文版 :Mastering the game of Go without human knowledge 緒論長久以來，人工智能的目標是在富有挑戰性的領域中學習出一種從無知幼兒到超級專家的算法。最近，AlphaGo已經成爲第一個在圍棋比賽中打敗世界冠軍的程序。AlphaGo中的樹搜索使用深度神經網絡來評估棋局和選擇動作。這些神經網絡是利用人類專家的

>>阅读原文<<