COMA(二):Counterfactual Multi-Agent Policy Gradients 論文講解

Counterfactual Multi-Agent Policy Gradients 論文鏈接:https://arxiv.org/pdf/1705.08926.pdf 1. 問題提出(解決了什麼問題?) 在現實世界中,有非常多的問題需要多個單位之間的「合作」才能完成任務,這就需要學習一種非中心式策略的控制系統,即每個agent有着屬於自己的決策大腦,而非靠擁有全局信息的決策系統下達指令(畢竟有
相關文章
相關標籤/搜索