論文筆記6:Increasing the Action Gap: New Operators for Reinforcement Learning

參考文獻:New Operators for Reinforcement Learning 同名知乎:uuummmmiiii 這篇文章實在是式子多,整個看懵,網上目前沒啥人看過這篇,論文有兩部分,我掙扎了一下看了第一部分,所以第二部分具體作者創新了什麼,做了什麼相關推導我也不知道,哭泣。 如有錯誤還請指出,本人小白,希望幫助更多的人,一同進步。 論文分爲兩部分:前部分:作者介紹新提出的新算子。 後
相關文章
相關標籤/搜索