深度強化學習落地寶典(3)——算法選擇篇

目錄 前言 強化學習——探索和利用的平衡遊戲 DQN DDPG A3C 其他算法 前言 雖然每年RL方向的paper滿天飛,但真正具有普遍實用價值的突破性工作實在不多,大多數還是在經典框架基礎上的改進和擴展。DRL常規武器庫裏的存貨主要還是老三樣:DQN,DDPG和A3C,它們是深度學習時代最成熟、最能體現智慧結晶的三個DRL框架,你可以在GitHub上找到無數相關代碼,有OpenAI,NVIDI
相關文章
相關標籤/搜索