遷移學習在多智能體強化學習中的應用(Action Advising)

十三、Action Advising 1、Multi-Agent RL 中的 Transfer Learning (1)一些定義 在多智能體系統中使用TL是爲了重複利用已經學到的知識從而提高學習的速度並且使原本複雜的任務變得容易學習。多智能體系統的TL中有如下幾個概念: 1、knowledge space K \mathscr{K} K :它包含了當前的任務(target task)中的sampl
相關文章
相關標籤/搜索