【論文翻譯】Playing Atari with Deep Reinforcement Learning

時間 2020-12-24

標籤強化學習 Q-learning 人工智能简体版

原文原文鏈接

摘要：我們第一個提出了利用強化學習成功地從高維輸入中直接學習控制策略的深度學習模型。該模型是一個卷積神經網絡，經過Q-learning的、訓練，輸入爲原始像素，輸出爲用來估計未來reward的價值函數。我們將我們的方法應用於遊戲廳學習環境下的7款atari 2600遊戲，沒有調整過架構或學習算法。我們發現它在6個遊戲中超越了所有以前的方法，並且在3個遊戲中超過了人類專家。 1 . Introduc

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。