Relational Deep Reinforcement Learning

Abstract 我們介紹了一種深度強化學習的方法,它通過結構化感知和關係推理提高了傳統方法的效率、泛化能力和可解釋性。它使用self-attention來迭代推理場景中實體之間的關係,並指導無模型策略。我們的結果表明,在一種名爲Box-World的新的導航和規劃任務中,我們的agent找到了可解釋的解決方案,這些解決方案在樣本複雜性、泛化到比訓練期間所經歷的更復雜的場景的能力以及整體性能方面都有
相關文章
相關標籤/搜索