QMIX:用於深度多智能體強化學習的單調值函數分解

多智能體強化學習-QMIX 論文名稱:QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning 01 介紹 在多智能體強化學習中一種比較典型的學習模式爲中心式訓練,分佈式執行,即在訓練時利用所共享的信息來幫助更有效的分佈式執行。然而,圍繞如何最好地利用集中培訓仍然存在着許多挑戰。
相關文章
相關標籤/搜索