「重磅綜述」多智能體強化學習算法理論研究「AI核心算法」

關注:決策智能與機器學習,深耕AI脫水乾貨 作者 |  劉浚嘉 報道 |  DeepRL Image 雖然目前多智能體強化學習 MARL 在很多領域取得了不錯的結果,但很少有相關的理論分析。本綜述挑選並彙總了擁有理論支撐的 MARL 算法,主要是以下兩種理論框架: Markov / stochastic games 馬爾可夫/隨機博弈 extensive-form games 形式廣泛的遊戲 並關
相關文章
相關標籤/搜索