閱讀QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

時間 2021-01-02

標籤多智能體強化學習简体版

原文原文鏈接

接上文VDN，本來我覺得QMIX全文會很難讀，後來發現不是，哈哈，又畏難了，希望我挑戰QTRAN和Qatten的時候也能這樣。 QMIX 題目作者摘要方法實驗和結果其他題目作者 ICML18，作者是COMA那個團隊，老師應該就是 Shimon Whiteson，好像是Peter Stone的學生，後者是做多智能體的大佬。摘要這篇文章是接着VDN做的，也就是對於基於team rewar

>>阅读原文<<