多巴胺:谷歌開源新型增強學習框架

  https://www.cnblogs.com/DicksonJYL/p/9569139.html   Google 近日宣佈開源一個新的基於 Tensorflow 的框架 —— Dopamine,旨在爲新手和資深 RL(強化學習)研究人員提供靈活性、穩定性和可重複性。該框架受大腦中的獎勵動機行爲啓發,反映了神經科學與強化學習研究之間的強歷史聯繫,旨在實現可以推動激進發現的投機性研究。 Dop
相關文章
相關標籤/搜索