深度學習(四十)——深度強化學習(3)Deep Q-learning Network(2), DQN進化史

Deep Q-learning Network(續) Nature DQN DQN最早發表於NIPS 2013,該版本的DQN,也被稱爲NIPS DQN。NIPS DQN除了提出DQN的基本概念之外,還使用了《機器學習(三十三)》中提到的Experience Replay技術。 2015年初,Deepmind在Nature上提出了改進版本,是爲Nature DQN。它改進了Loss函數: L =
相關文章
相關標籤/搜索