強化學習 之 多智能體(Multi-Agent)強化學習

參考 1、多智能體強化學習入門(一)——基礎知識與博弈 2、《Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments》論文解讀 簡介 一個隨機博弈可以看成是一個多智能體強化學習過程,在隨機博弈中假定每個狀態的獎勵矩陣是已知的,不需要學習。而多智能體強化學習則是通過與環境的不斷交互來學習每個狀態的獎勵值函數,再通
相關文章
相關標籤/搜索