元強化學習（1）：Meta-learning in Reinforcement Learning

時間 2021-01-01

原文原文鏈接

強化學習在展現其強大學習能力的同時也深受其自身特性的困擾：系統的脆弱性和對超參數的依賴性。這一點在現今的複雜深度強化學習系統中表現的尤爲突出。因此，近年來，元強化學習漸漸迴歸視線，即將基礎強化學習方法中手動設定的超參數設定爲元參數，通過元學習方法學習和調整元參數，進一步指導底層的強化學習過程。打算最近介紹一個系列，今天先來說說這篇2003年的Meta-learning in Reinforcem

>>阅读原文<<