Noisy DQN

論文鏈接:Noisy DQN(MeireFortunato et al., 2019) 在深度強化學習智能體中引入了參數噪聲—— NoisyNet,並且該智能體策略的隨機性可以用來幫助有效的探索。利用梯度下降法學習噪聲參數和剩餘網絡權值。對於 A3C,DQN,Dueling Agent,可以使用這個 NoisyNet 來替代傳統的探索啓發式方法(如,熵獎勵和 ϵ − g r e e d y \ep
相關文章
相關標籤/搜索