Dopamine - 靈活、可重複的強化學習研究新框架

時間 2021-01-06

原文原文鏈接

文 / 研究軟件開發人員 Pablo Samuel Castro 和Google Brain Team 研究科學家 Marc G. Bellemare 在過去的幾年中，強化學習（RL）研究取得了多方面的重大進展。這些進步使 AI 智能體能夠在一些遊戲上超越人類 – 其中，令人矚目的例子有：DeepMind 攻破 Atari 遊戲的 DQN，在圍棋中獲得矚目的 AlphaGo 和 AlphaGo

>>阅读原文<<