閱讀COMA:Counterfactual Multi-Agent Policy Gradients

COMA 題目 作者 摘要 主要方法 環境 代碼 其他 題目 Counterfactual Multi-Agent Policy Gradients,AAAI2018 作者 牛津做多智能體強化學習的大佬組,後續多智能體強化學習的很多工作比如MAVEN也還是這個組做的,這裏的Jakob N. Foerster很厲害,現在在FaceBook AI,他通信、多智能體競爭、合作都在研究。 摘要 單純的強化
相關文章
相關標籤/搜索