元強化學習(1):Meta-learning in Reinforcement Learning

強化學習在展現其強大學習能力的同時也深受其自身特性的困擾:系統的脆弱性和對超參數的依賴性。這一點在現今的複雜深度強化學習系統中表現的尤爲突出。因此,近年來,元強化學習漸漸迴歸視線,即將基礎強化學習方法中手動設定的超參數設定爲元參數,通過元學習方法學習和調整元參數,進一步指導底層的強化學習過程。 打算最近介紹一個系列,今天先來說說這篇2003年的Meta-learning in Reinforcem
相關文章
相關標籤/搜索