102頁PPT，DeepMind強化學習最新進展，含圖文、公式和代碼

時間 2020-12-24

原文原文鏈接

來源：專知本文多圖，建議閱讀9分鐘本文提供涵蓋了強化學習RL基礎概念、策略梯度、動態規劃以及D4PG、R2D3等RL算法的資源。 [ 導讀 ] 在DeepMing任職的Nando de Freitas（原牛津大學教授）在KHIPU 2019上做了關於強化學習（RL）的教程，102頁ppt。涵蓋了強化學習RL基礎概念、策略梯度、動態規劃以及D4PG、R2D3等RL算法，並介紹了RL的應用。在K

>>阅读原文<<