多智能體強化學習博弈系列（1）- 差分博弈和模糊系統

時間 2021-01-16

原文原文鏈接

幾點說明：這個系列重點關注多智能體和強化學習在差分博弈中的應用，文章中有嘗試復現的主要是雙人/多人混合策略多階段隨機差分零和遊戲的模擬。關於智能體、關於強化學習、關於博弈論基礎的介紹，在這個系列基本不涉及。強化學習簡簡簡介見我之前的文章。多智能體簡簡簡介見我之前的文章。有關博弈論基礎的內容，e.g. 雙人/多人遊戲、零和/變和遊戲、單一/混合策略、單一/多階段博弈等概念，本文不涉及，有興趣