PARL源碼走讀——使用策略梯度算法求解迷宮尋寶問題

時間 2020-07-20

標籤 parl 源碼走讀使用策略梯度算法求解迷宮尋寶問題简体版

原文原文鏈接

前不久，百度發佈了基於PaddlePaddle的深度強化學習框架PARL。git傳送門python 做爲一個強化學習小白，本人懷着學習的心態，安裝並運行了PARL裏的quick-start。不體驗不知道，一體驗嚇一跳，不愧是 NeurIPS 2018 冠軍團隊的傑做，代碼可讀性良好，函數功能很是清晰，模塊之間耦合度低、內聚性強。不只僅適合零基礎的小白快速搭建DRL環境，也十分適合科研人員復現論文結

>>阅读原文<<