Value-Decomposition Networks For Cooperative Multi-Agent Learning筆記

Value-Decomposition Networks For Cooperative Multi-Agent Learning 1. 論文講了什麼/主要貢獻是什麼 多代理強化學習任務的解決方案存在完全集中,和獨立學習兩種方案。將二者結合,得到了集中學習、分散決策的值分解網絡,並利用已有技術如DQN架構、目標網絡、經驗回放、Dueling網絡以及面向部分可觀測環境下采用的RNN網絡,設計出值分解
相關文章
相關標籤/搜索