DeepMind提出多任務強化學習新方法Distral

時間 2020-12-30

標籤強化學習多任務強化學習 Reinforcement Learning Multitask Reinforcement Learni 欄目 Google 简体版

原文原文鏈接

選自arXiv 機器之心編譯參與：蔣思源、黃小天深度強化學習因爲複雜的環境而很難進行有效的訓練，通常我們會簡化環境或使用共享神經網絡參數的方法進行多任務學習，但採用這種方法的學習並不穩定。因此 DeepMind 近日發表了一篇論文，並提出了一種用於多任務的聯合訓練的新方法—Distral（提取&遷移學習）。論文鏈接：https://arxiv.org/pdf/1707.04175.pdf

>>阅读原文<<