探祕多智能體強化學習-MADDPG算法原理及簡單實現

以前接觸的強化學習算法都是單個智能體的強化學習算法,可是也有不少重要的應用場景牽涉到多個智能體之間的交互,好比說,多個機器人的控制,語言的交流,多玩家的遊戲等等。本文,就帶你簡單瞭解一下Open-AI的MADDPG(Multi-Agent Deep Deterministic Policy Gradient)算法,來共同體驗一下多智能體強化學習的魅力。git 論文全稱:Multi-Agent Ac
相關文章
相關標籤/搜索