神經網絡與強化學習

一、DQN的神經網絡是怎樣一種結構?有幾層?什麼作用?如何實現數據的記憶?如何做一些改進 (一)問題描述: qu1. 問題複雜度提高導致無法使用Q表記錄全部狀態:        1. 對狀態的維度進行壓縮,解決方案之一Value Function Approximation(值函數近似),        用w來表示函數f的參數,則有        2. 高維s和低維a的函數輸入問題,低維a無需進行
相關文章
相關標籤/搜索