深度強化學習落地寶典（3）——算法選擇篇

時間 2021-01-12

原文原文鏈接

目錄前言強化學習——探索和利用的平衡遊戲 DQN DDPG A3C 其他算法前言雖然每年RL方向的paper滿天飛，但真正具有普遍實用價值的突破性工作實在不多，大多數還是在經典框架基礎上的改進和擴展。DRL常規武器庫裏的存貨主要還是老三樣：DQN，DDPG和A3C，它們是深度學習時代最成熟、最能體現智慧結晶的三個DRL框架，你可以在GitHub上找到無數相關代碼，有OpenAI，NVIDI

>>阅读原文<<