9. 基於近似的在線策略預測方法--閱讀筆記【Reinforcement Learning An Introduction 2nd】

文章目錄 基於近似的在線策略預測方法 前言 1.值函數近似 2.預測目標 V E ‾ \overline {VE} VE 3.隨機梯度和半梯度方法stochastic-gradient and semi-gradient 4.線性方法 5.線性方法的特徵構造 5.1 多項式方法 5.2 傅里葉基 5.3 coarse coding粗糙編碼特徵 5.4 tile coding堆編碼/瓦片編碼 5.5
相關文章
相關標籤/搜索