[強化學習-5] 值函數近似

值函數近似 前幾篇博客講了如何進行值函數估計,估計完之後這些結果怎麼保持呢,狀態動作空間很小的就存在表中,用的時候查表獲取v(s)和Q(s, a),但當狀態空間是高維連續時,需要儲存的東西就太多了,這個表就不行了,這時我們會採用函數近似(function approximation)的方式對值函數進行參數化近似: 一般的函數近似有 - Linear combinations of features
相關文章
相關標籤/搜索