探祕多智能體強化學習-MADDPG算法原理及簡單實現

時間 2020-07-26

標籤探祕智能強化學習 maddpg 算法原理簡單實現简体版

原文原文鏈接

以前接觸的強化學習算法都是單個智能體的強化學習算法，可是也有不少重要的應用場景牽涉到多個智能體之間的交互，好比說，多個機器人的控制，語言的交流，多玩家的遊戲等等。本文，就帶你簡單瞭解一下Open-AI的MADDPG(Multi-Agent Deep Deterministic Policy Gradient)算法，來共同體驗一下多智能體強化學習的魅力。git 論文全稱：Multi-Agent Ac

>>阅读原文<<