PARL源碼走讀——使用策略梯度算法求解迷宮尋寶問題

前不久,百度發佈了基於PaddlePaddle的深度強化學習框架PARL。git傳送門python 做爲一個強化學習小白,本人懷着學習的心態,安裝並運行了PARL裏的quick-start。不體驗不知道,一體驗嚇一跳,不愧是 NeurIPS 2018 冠軍團隊的傑做,代碼可讀性良好,函數功能很是清晰,模塊之間耦合度低、內聚性強。不只僅適合零基礎的小白快速搭建DRL環境,也十分適合科研人員復現論文結
相關文章
相關標籤/搜索