論文筆記6：Increasing the Action Gap: New Operators for Reinforcement Learning

時間 2020-12-27

標籤 DQN 深度強化學習論文筆記简体版

原文原文鏈接

參考文獻：New Operators for Reinforcement Learning 同名知乎：uuummmmiiii 這篇文章實在是式子多，整個看懵，網上目前沒啥人看過這篇，論文有兩部分，我掙扎了一下看了第一部分，所以第二部分具體作者創新了什麼，做了什麼相關推導我也不知道，哭泣。如有錯誤還請指出，本人小白，希望幫助更多的人，一同進步。論文分爲兩部分：前部分：作者介紹新提出的新算子。後

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。