【華爲雲技術分享】華爲開發者大會HDC.Cloud帶你探索強化學習三大挑戰及落地實踐

時間 2020-12-31

原文原文鏈接

2015-2017年間，AlphaGo系列事件宣告在圍棋領域AI算法戰勝人類世界冠軍，這主要得益於其背後的核心技術-深度強化學習技術。之後研究者開始轉向更加複雜的對戰博弈場景，典型例子如Deepmind星際下AlphaStar，和OpenAI dota 下的OpenAi Five，並且均表現出接近甚至超越人類專業玩家的水準，引起了廣泛反響和關注。研究者通過在能充分反應真實世界中抽象問題的博弈遊戲場

>>阅读原文<<