DeepMind Nando（原牛津大學教授）強化學習最新進展，含圖文、公式和代碼，附102頁PPT下載...

時間 2020-12-24

原文原文鏈接

點擊上方「AI遇見機器學習」，選擇「星標」公衆號重磅乾貨，第一時間送轉自：專知【導讀】在DeepMing任職的Nando de Freitas（原牛津大學教授）在KHIPU 2019上做了關於強化學習（RL）的教程，102頁ppt。涵蓋了強化學習RL基礎概念、策略梯度、動態規劃以及D4PG、R2D3等RL算法，並介紹了RL的應用。在KHIPU 2019（Latin American Mee