DeepMind強化學習綜述:快速和緩慢的強化學習

背景 近年來,深度強化學習(RL)方法在人工智能方面取得了令人矚目的進步,在從Atari到Go到無限制撲克等領域都超過了人類的表現。 這一進展引起了對了解人類學習感興趣的認知科學家的關注。但是,人們一直擔心,深層RL可能太低樣本效率-也就是說,它可能太慢-無法爲人類學習提供一個合理的模型。 在本綜述中,作者通過描述最近開發的技術來反駁這種批評,這些技術使深層RL能夠更靈活地運行,比以前的方法更快地
相關文章
相關標籤/搜索