零和博弈中範式概率的計算

1. 問題 數學家約翰·馮·諾伊曼認爲概率可以解決這一困境。這兩名玩家應對其可選的行動計算其勝出概率,然後根據這些概率,使用一個隨機邏輯元件,選擇他們的行動。每個玩家計算概率。這極小化極大算法可以計算所有二人零和遊戲的最佳戰略。 對應上面的例子,紅方選擇動作1的概率爲4/7和行動2的概率爲3/7,而藍方選擇動作的概率爲0、4/7和3/7,對應A、B和C三個行動。及後紅方平均每場比賽將會贏得20/7
相關文章
相關標籤/搜索