Dopamine - 靈活、可重複的強化學習研究新框架

文 / 研究軟件開發人員 Pablo Samuel Castro 和Google Brain Team 研究科學家 Marc G. Bellemare 來源 | 谷歌開發者 公衆號 在過去的幾年中,強化學習(RL)研究取得了多方面的重大進展。 這些進步使 AI 智能體能夠在一些遊戲上超越人類 – 其中,令人矚目的例子有:DeepMind 攻破 Atari 遊戲的 DQN,在圍棋中獲得矚目的 Alp
相關文章
相關標籤/搜索