DeepMind Nando(原牛津大學教授)強化學習最新進展,含圖文、公式和代碼,附102頁PPT下載...

點擊上方「AI遇見機器學習」,選擇「星標」公衆號 重磅乾貨,第一時間送 轉自:專知 【導讀】在DeepMing任職的Nando de Freitas(原牛津大學教授)在KHIPU 2019上做了關於強化學習(RL)的教程,102頁ppt。涵蓋了強化學習RL基礎概念、策略梯度、動態規劃以及D4PG、R2D3等RL算法,並介紹了RL的應用。 在KHIPU 2019(Latin American Mee
相關文章
相關標籤/搜索