多智能體強化學習-COMA

多智能體強化學習-COMA 論文全稱:Counterfactual Multi-Agent Policy Gradients 論文地址:https://arxiv.org/abs/1705.08926v1 摘要 協作多智能體系統可以很自然地用於建模許多現實世界的問題,例如網絡分組路由或自主車輛的協調。因此,需要新的強化學習方法來有效地學習這種系統的分散策略。爲此,提出了一種新的多智能體參與者批評方
相關文章
相關標籤/搜索