9. 基於近似的在線策略預測方法--閱讀筆記【Reinforcement Learning An Introduction 2nd】

時間 2021-01-15

標籤 # RL An Introduction 2nd讀書筆記強化學習深度學習简体版

原文原文鏈接

文章目錄基於近似的在線策略預測方法前言 1.值函數近似 2.預測目標 V E ‾ \overline {VE} VE 3.隨機梯度和半梯度方法stochastic-gradient and semi-gradient 4.線性方法 5.線性方法的特徵構造 5.1 多項式方法 5.2 傅里葉基 5.3 coarse coding粗糙編碼特徵 5.4 tile coding堆編碼/瓦片編碼 5.5

>>阅读原文<<