多智能體強化學習-COMA

時間 2021-01-13

原文原文鏈接

多智能體強化學習-COMA 論文全稱：Counterfactual Multi-Agent Policy Gradients 論文地址:https://arxiv.org/abs/1705.08926v1 摘要協作多智能體系統可以很自然地用於建模許多現實世界的問題，例如網絡分組路由或自主車輛的協調。因此，需要新的強化學習方法來有效地學習這種系統的分散策略。爲此，提出了一種新的多智能體參與者批評方

>>阅读原文<<