Google發佈「多巴胺」開源強化學習框架,三大特性全滿足

 編譯整理 | Just 編輯 | 阿司匹林 出品 | AI科技大本營  強化學習是一種非常重要 AI 技術,它能使用獎勵(或懲罰)來驅動智能體(agents)朝着特定目標前進,比如它訓練的 AI 系統 AlphaGo 擊敗了頂尖圍棋選手,它也是 DeepMind 的深度 Q 網絡(DQN)的核心部分,它可以在多個 workers 之間分步學習,例如,在 Atari 2600 遊戲中實現「超
相關文章
相關標籤/搜索