探祕多智能體強化學習-MADDPG算法原理及簡單實現

時間 2021-01-16

原文原文鏈接

之前接觸的強化學習算法都是單個智能體的強化學習算法，但是也有很多重要的應用場景牽涉到多個智能體之間的交互，比如說，多個機器人的控制，語言的交流，多玩家的遊戲等等。本文，就帶你簡單瞭解一下Open-AI的MADDPG(Multi-Agent Deep Deterministic Policy Gradient)算法，來共同體驗一下多智能體強化學習的魅力。論文全稱：Multi-Agent Actor

>>阅读原文<<