【推薦】快速超好用的RL強化學習框架——天授1500行代碼實現DQN /PG/A2C

強化學習算法已經有各類實現平臺,譬如基於tensorflow的OpenAI Baselines,rllib,基於Pytorch的 PyTorch DRL ,rlpyt。最新推薦一個輕量快速實現的RL框架,由清華大學的本科生推出,相比於以前的RL平臺,有一下幾點優點:html 實現簡潔,輕巧:1500行代碼搞定 模塊化:多種不一樣API可供調用,輪子多就是好 調用方便,速度快,3秒鐘實現一個PG算法
相關文章
相關標籤/搜索