DeepMind強化學習綜述:快速和緩慢的強化學習

時間 2021-01-01

原文原文鏈接

背景近年來，深度強化學習（RL）方法在人工智能方面取得了令人矚目的進步，在從Atari到Go到無限制撲克等領域都超過了人類的表現。這一進展引起了對了解人類學習感興趣的認知科學家的關注。但是，人們一直擔心，深層RL可能太低樣本效率-也就是說，它可能太慢-無法爲人類學習提供一個合理的模型。在本綜述中，作者通過描述最近開發的技術來反駁這種批評，這些技術使深層RL能夠更靈活地運行，比以前的方法更快地

>>阅读原文<<