DeepMind推出分佈式深度強化學習架構IMPALA，讓一個Agent學會多種技能

時間 2021-01-01

標籤強化學習 Reinforcement Learning 分佈式強化學習欄目 Google 简体版

原文原文鏈接

目前，深度增強學習（DeepRL）技術在多種任務中都大獲成功，無論是機器人的持續控制問題，還是掌握圍棋和雅達利的電子遊戲。不過，這些方面的進展僅限於孤立任務。完成每一項任務都要單獨調試、訓練agent。在最近的工作中，我們研究瞭如何訓練單一agent去執行多種任務。今天，我們發佈了DMLab-30。這是一組新任務，包含了在統一視覺環境、通用動作空間（action space）中的多種類型挑戰。

>>阅读原文<<