深度強化學習(一)—— Deep Q Network(DQN)

一、背景 DeepMind2013年的論文《Playing Atari with Deep Reinforcement Learning》指出:從高維感知輸入(如視覺、語音)直接學習如何控制 agent 對強化學習(RL)來說是一大挑戰。 之前很多RL算法依賴於手工選取的特徵和線性函數逼近(對value function(值函數) 或 policy進行逼近)。但這些系統都依賴於特徵的選取質量。 深
相關文章
相關標籤/搜索