DeepMind推出分佈式深度強化學習架構IMPALA,讓一個Agent學會多種技能

維金 編譯自 DeepMind Blog 量子位 出品 | 公衆號 QbitAI 目前,深度加強學習(DeepRL)技術在多種任務中都大獲成功,不管是機器人的持續控制問題,仍是掌握圍棋和雅達利的電子遊戲。不過,這些方面的進展僅限於孤立任務。完成每一項任務都要單獨調試、訓練agent。git 在最近的工做中,咱們研究瞭如何訓練單一agent去執行多種任務。github 今天,咱們發佈了DMLab-3
相關文章
相關標籤/搜索