論文筆記5:How to Discount Deep Reinforcement Learning:Towards New Dynamic Strategies

參考資料:How to Discount Deep Reinforcement Learning: ... 爲幫助跟我一樣的小白,如果有大神看到錯誤,還請您指出,謝謝~ 知乎同名:uuummmmiiii 創新點:相比於原始DQN不固定折扣因子(discount factor,γ),學習率(learning rate,α) 改進:變化discount factor 和 learning rate 改
相關文章
相關標籤/搜索