Google發佈「多巴胺」開源強化學習框架,三大特性全知足

html 編譯整理 | Justgit 編輯 | 阿司匹林github 出品 | AI科技大本營算法 網絡 強化學習是一種很是重要 AI 技術,它能使用獎勵(或懲罰)來驅動智能體(agents)朝着特定目標前進,好比它訓練的 AI 系統 AlphaGo 擊敗了頂尖圍棋選手,它也是 DeepMind 的深度 Q 網絡(DQN)的核心部分,它能夠在多個 workers 之間分步學習,例如,在 A
相關文章
相關標籤/搜索