神經網絡與強化學習

時間 2020-12-24

原文原文鏈接

一、DQN的神經網絡是怎樣一種結構？有幾層？什麼作用？如何實現數據的記憶？如何做一些改進（一）問題描述： qu1. 問題複雜度提高導致無法使用Q表記錄全部狀態： 1. 對狀態的維度進行壓縮，解決方案之一Value Function Approximation（值函數近似），用w來表示函數f的參數，則有 2. 高維s和低維a的函數輸入問題，低維a無需進行

>>阅读原文<<