Noisy DQN

時間 2020-12-27

原文原文鏈接

論文鏈接：Noisy DQN（MeireFortunato et al., 2019）在深度強化學習智能體中引入了參數噪聲—— NoisyNet，並且該智能體策略的隨機性可以用來幫助有效的探索。利用梯度下降法學習噪聲參數和剩餘網絡權值。對於 A3C，DQN，Dueling Agent，可以使用這個 NoisyNet 來替代傳統的探索啓發式方法（如，熵獎勵和 ϵ − g r e e d y \ep

>>阅读原文<<

相關文章

1. 6.DQN(Deep Q-Network)+Double DQN+Dueling DQN
2. Double DQN and Dueling DQN
3. Nature DQN與Double DQN
4. DQN——Deep Q Network
5. DQN
6. Prioritized Replay DQN與Dueling DQN
7. GAN-DQN
8. Prioritized DQN
9. Double DQN
10. Self-training with Noisy Student
更多相關文章...

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

1. 6.DQN(Deep Q-Network)+Double DQN+Dueling DQN
2. Double DQN and Dueling DQN
3. Nature DQN與Double DQN
4. DQN——Deep Q Network
5. DQN
6. Prioritized Replay DQN與Dueling DQN
7. GAN-DQN
8. Prioritized DQN
9. Double DQN
10. Self-training with Noisy Student

>>更多相關文章<<