「重磅綜述」多智能體強化學習算法理論研究「AI核心算法」

時間 2021-01-13

原文原文鏈接

關注：決策智能與機器學習，深耕AI脫水乾貨作者 | 劉浚嘉報道 | DeepRL Image 雖然目前多智能體強化學習 MARL 在很多領域取得了不錯的結果，但很少有相關的理論分析。本綜述挑選並彙總了擁有理論支撐的 MARL 算法，主要是以下兩種理論框架： Markov / stochastic games 馬爾可夫/隨機博弈 extensive-form games 形式廣泛的遊戲並關

>>阅读原文<<