DeepMind提出多任務強化學習新方法Distral

選自arXiv 機器之心編譯 參與:蔣思源、黃小天 深度強化學習因爲複雜的環境而很難進行有效的訓練,通常我們會簡化環境或使用共享神經網絡參數的方法進行多任務學習,但採用這種方法的學習並不穩定。因此 DeepMind 近日發表了一篇論文,並提出了一種用於多任務的聯合訓練的新方法—Distral(提取&遷移學習)。   論文鏈接:https://arxiv.org/pdf/1707.04175.pdf
相關文章
相關標籤/搜索