JavaShuo
欄目
標籤
【論文翻譯】Playing Atari with Deep Reinforcement Learning
時間 2020-12-24
標籤
強化學習
Q-learning
人工智能
简体版
原文
原文鏈接
摘要:我們第一個提出了利用強化學習成功地從高維輸入中直接學習控制策略的深度學習模型。該模型是一個卷積神經網絡,經過Q-learning的、訓練,輸入爲原始像素,輸出爲用來估計未來reward的價值函數。我們將我們的方法應用於遊戲廳學習環境下的7款atari 2600遊戲,沒有調整過架構或學習算法。我們發現它在6個遊戲中超越了所有以前的方法,並且在3個遊戲中超過了人類專家。 1 . Introduc
>>阅读原文<<
相關文章
1.
論文筆記:《Playing Atari with Deep Reinforcement Learning》
2.
Playing Atari with Deep Reinforcement Learning
3.
Playing atari with deep reinforcement learning
4.
Playing Atari with Deep Reinforcement Learning 中文 講解
5.
NIPS-2013:Playing Atari with Deep Reinforcement Learning
6.
Paper reading: Playing Atari with Deep Reinforcement Learning
7.
【5分鐘 Paper】Playing Atari with Deep Reinforcement Learning
8.
RL論文閱讀【一】Playing Atari with Deep Reinforcement Learning
9.
【5分鐘 Paper】Continuous Control With Deep Reinforcement Learning
10.
論文翻譯:Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition
更多相關文章...
•
Eclipse 編譯項目
-
Eclipse 教程
•
CAP理論是什麼?
-
NoSQL教程
•
Scala 中文亂碼解決
•
三篇文章瞭解 TiDB 技術內幕——說存儲
相關標籤/搜索
論文翻譯
Deep Learning
atari
playing
reinforcement
好文翻譯
外文翻譯
文檔翻譯
全文翻譯
learning
MySQL教程
PHP教程
Thymeleaf 教程
文件系統
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
FM理論與實踐
2.
Google開發者大會,你想知道的都在這裏
3.
IRIG-B碼對時理解
4.
乾貨:嵌入式系統設計開發大全!(萬字總結)
5.
從域名到網站—虛機篇
6.
php學習5
7.
關於ANR線程阻塞那些坑
8.
android studio databinding和include使用控件id獲取報錯 不影響項目正常運行
9.
我女朋友都會的安卓逆向(四 動態調試smali)
10.
io存取速度
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
論文筆記:《Playing Atari with Deep Reinforcement Learning》
2.
Playing Atari with Deep Reinforcement Learning
3.
Playing atari with deep reinforcement learning
4.
Playing Atari with Deep Reinforcement Learning 中文 講解
5.
NIPS-2013:Playing Atari with Deep Reinforcement Learning
6.
Paper reading: Playing Atari with Deep Reinforcement Learning
7.
【5分鐘 Paper】Playing Atari with Deep Reinforcement Learning
8.
RL論文閱讀【一】Playing Atari with Deep Reinforcement Learning
9.
【5分鐘 Paper】Continuous Control With Deep Reinforcement Learning
10.
論文翻譯:Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition
>>更多相關文章<<