深度強化學習筆記——基本方法分類與一般思路

概要 本文梳理了一下臺大李宏毅老師的深度強化學習系列課程內容。該課程主要是對無模型深度強化學習方法的一些大致介紹,將其分爲大致三類:基於值函數的、基於梯度的方法、actor-critic的方法。(其他方法還有模仿學習imitation learning與逆強化學習inverse reinforcement learning) 分類方法可以見下圖: 本文對三大類方法的基本思路進行闡述,爲了寫作的方便
相關文章
相關標籤/搜索