SEED RL — 大規模擴展強化學習

文 / Google Research 阿姆斯特丹分部研究工程師 Lasse Espeholt 過去幾年間,強化學習 (RL) 取得了令人矚目的進展,近期在 圍棋 (Go) 和 Dota 2 等遊戲上取得的成功也有力地證明了這一點。模型或 智能體,通過探索環境(如遊戲)來學習,同時針對特定目標進行優化。但是,目前的 RL 技術需要大量的訓練才能成功完成學習,即便是簡單遊戲,這也使得迭代研究和產品構
相關文章
相關標籤/搜索