SEED RL — 大規模擴展強化學習

時間 2021-01-13

原文原文鏈接

文 / Google Research 阿姆斯特丹分部研究工程師 Lasse Espeholt 過去幾年間，強化學習 (RL) 取得了令人矚目的進展，近期在圍棋 (Go) 和 Dota 2 等遊戲上取得的成功也有力地證明了這一點。模型或智能體，通過探索環境（如遊戲）來學習，同時針對特定目標進行優化。但是，目前的 RL 技術需要大量的訓練才能成功完成學習，即便是簡單遊戲，這也使得迭代研究和產品構

>>阅读原文<<