【論文翻譯】Playing Atari with Deep Reinforcement Learning

摘要:我們第一個提出了利用強化學習成功地從高維輸入中直接學習控制策略的深度學習模型。該模型是一個卷積神經網絡,經過Q-learning的、訓練,輸入爲原始像素,輸出爲用來估計未來reward的價值函數。我們將我們的方法應用於遊戲廳學習環境下的7款atari 2600遊戲,沒有調整過架構或學習算法。我們發現它在6個遊戲中超越了所有以前的方法,並且在3個遊戲中超過了人類專家。 1 . Introduc
相關文章
相關標籤/搜索