DeepMind推出分佈式深度強化學習架構IMPALA,讓一個Agent學會多種技能

目前,深度增強學習(DeepRL)技術在多種任務中都大獲成功,無論是機器人的持續控制問題,還是掌握圍棋和雅達利的電子遊戲。不過,這些方面的進展僅限於孤立任務。完成每一項任務都要單獨調試、訓練agent。 在最近的工作中,我們研究瞭如何訓練單一agent去執行多種任務。 今天,我們發佈了DMLab-30。這是一組新任務,包含了在統一視覺環境、通用動作空間(action space)中的多種類型挑戰。
相關文章
相關標籤/搜索