COMA（二）：Counterfactual Multi-Agent Policy Gradients 論文講解

時間 2021-07-12

標籤 Deep Reinforcement Learning 機器學習強化學習深度學習简体版

原文原文鏈接

Counterfactual Multi-Agent Policy Gradients 論文鏈接：https://arxiv.org/pdf/1705.08926.pdf 1. 問題提出（解決了什麼問題？）在現實世界中，有非常多的問題需要多個單位之間的「合作」才能完成任務，這就需要學習一種非中心式策略的控制系統，即每個agent有着屬於自己的決策大腦，而非靠擁有全局信息的決策系統下達指令（畢竟有

>>阅读原文<<