閱讀QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

接上文VDN,本來我覺得QMIX全文會很難讀,後來發現不是,哈哈,又畏難了,希望我挑戰QTRAN和Qatten的時候也能這樣。 QMIX 題目作者 摘要 方法 實驗和結果 其他 題目作者 ICML18,作者是COMA那個團隊,老師應該就是 Shimon Whiteson,好像是Peter Stone的學生,後者是做多智能體的大佬。 摘要 這篇文章是接着VDN做的,也就是對於基於team rewar
相關文章
相關標籤/搜索