【華爲雲技術分享】華爲開發者大會HDC.Cloud帶你探索強化學習三大挑戰及落地實踐

2015-2017年間,AlphaGo系列事件宣告在圍棋領域AI算法戰勝人類世界冠軍,這主要得益於其背後的核心技術-深度強化學習技術。之後研究者開始轉向更加複雜的對戰博弈場景,典型例子如Deepmind星際下AlphaStar,和OpenAI dota 下的OpenAi Five,並且均表現出接近甚至超越人類專業玩家的水準,引起了廣泛反響和關注。研究者通過在能充分反應真實世界中抽象問題的博弈遊戲場
相關文章
相關標籤/搜索