Google發佈「多巴胺」開源強化學習框架，三大特性全滿足

時間 2021-01-15

原文原文鏈接

編譯整理 | Just 編輯 | 阿司匹林出品 | AI科技大本營強化學習是一種非常重要 AI 技術，它能使用獎勵（或懲罰）來驅動智能體（agents）朝着特定目標前進，比如它訓練的 AI 系統 AlphaGo 擊敗了頂尖圍棋選手，它也是 DeepMind 的深度 Q 網絡（DQN）的核心部分，它可以在多個 workers 之間分步學習，例如，在 Atari 2600 遊戲中實現「超

>>阅读原文<<