多智能體強化學習博弈系列(1)- 差分博弈和模糊系統

幾點說明: 這個系列重點關注多智能體和強化學習在差分博弈中的應用,文章中有嘗試復現的主要是雙人/多人混合策略多階段隨機差分零和遊戲的模擬。關於智能體、關於強化學習、關於博弈論基礎的介紹,在這個系列基本不涉及。 強化學習簡簡簡介見我之前的文章。 多智能體簡簡簡介見我之前的文章。 有關博弈論基礎的內容,e.g. 雙人/多人遊戲、零和/變和遊戲、單一/混合策略、單一/多階段博弈等概念,本文不涉及,有興趣
相關文章
相關標籤/搜索