【5分鐘 Paper】Asynchronous Methods for Deep Reinforcement Learning

論文題目:Asynchronous Methods for Deep Reinforcement Learning 所解決的問題?   在強化學習算法中agent所觀測到的data是 non-stationary和strongly correlated的。通過設置memory的方式可以 reduces non-stationarity and decorrelates updates,但是會限制這
相關文章
相關標籤/搜索