世界冠軍帶你從零實踐-強化學習總結

世界冠軍帶你從零實踐-強化學習總結 課程內容 課程總結 課程內容 此次的課程內容主要是強化學習PARL框架的使用,其中使用到的算法爲DQN/DDPG兩種算法,在作做業的時候前邊幾回做業基本就是根據老師的代碼去運行的,也沒有太仔細的看。第四次做業的時候遇到一些問題,我將1e-3到9e-3這九個學習率所有都試了一下,其中2e-3和3e-3的效果是很是不錯的,尤爲是3e-3,可是我第二次運行的時候效果並
相關文章
相關標籤/搜索