深度強化學習筆記——基本方法分類與一般思路

時間 2021-01-13

標籤強化學習简体版

原文原文鏈接

概要本文梳理了一下臺大李宏毅老師的深度強化學習系列課程內容。該課程主要是對無模型深度強化學習方法的一些大致介紹，將其分爲大致三類：基於值函數的、基於梯度的方法、actor-critic的方法。（其他方法還有模仿學習imitation learning與逆強化學習inverse reinforcement learning）分類方法可以見下圖：本文對三大類方法的基本思路進行闡述，爲了寫作的方便

>>阅读原文<<