QMIX:用於深度多智能體強化學習的單調值函數分解

時間 2021-01-12

原文原文鏈接

多智能體強化學習-QMIX 論文名稱：QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning 01 介紹在多智能體強化學習中一種比較典型的學習模式爲中心式訓練，分佈式執行，即在訓練時利用所共享的信息來幫助更有效的分佈式執行。然而，圍繞如何最好地利用集中培訓仍然存在着許多挑戰。

>>阅读原文<<