Value-Decomposition Networks For Cooperative Multi-Agent Learning筆記

時間 2021-01-02

標籤論文閱讀筆記简体版

原文原文鏈接

Value-Decomposition Networks For Cooperative Multi-Agent Learning 1. 論文講了什麼/主要貢獻是什麼多代理強化學習任務的解決方案存在完全集中，和獨立學習兩種方案。將二者結合，得到了集中學習、分散決策的值分解網絡，並利用已有技術如DQN架構、目標網絡、經驗回放、Dueling網絡以及面向部分可觀測環境下采用的RNN網絡，設計出值分解

>>阅读原文<<