[強化學習實戰]函數近似方法-線性近似與函數近似的收斂性

線性近似 最常使用的函數近似就是線性近似和人工神經網絡。本節介紹線性近似。線性近似是用許多特徵向量的線性組合來近似價值函數。特徵向量則依賴於輸入(即狀態或狀態動作對)。以動作價值近似爲例,我們可以爲每個狀態動作對定義多個不同的特徵 x ( s , a ) = ( x j ( s , a ) : j ∈ J ) x(s,a)=(x_j(s,a):j∈\mathcal{J} ) x(s,a)=(xj​
相關文章
相關標籤/搜索