【強化學習】AlphaGo Zero論文

AlphaGo Zero論文中文版 :Mastering the game of Go without human knowledge 緒論          長久以來,人工智能的目標是在富有挑戰性的領域中學習出一種從無知幼兒到超級專家的算法。最近,AlphaGo已經成爲第一個在圍棋比賽中打敗世界冠軍的程序。AlphaGo中的樹搜索使用深度神經網絡來評估棋局和選擇動作。這些神經網絡是利用人類專家的
相關文章
相關標籤/搜索