本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
兩個明顯的條件:
\[ \sigma_i(s_{i}) \geq 0, \forall s_i \in S_i \\ \sum_{s_i \in S_i} \sigma_i(s_{i}) = 1 \]函數
\(\Delta S_i\)的例子:(rock-paper-scissor)
\(\Delta S_i\) = {(\sigma_i(R), \sigma_i(P), \sigma_i(S)) : \sigma_i(R), \sigma_i(P), \sigma_i(S) \geq 0, \sigma_i(R) + \sigma_i(P) + \sigma_i(S) = 1}$
表示全部\((\sigma_i(R), \sigma_i(P), \sigma_i(S))\)對,使得每一個值都大於等於0,而且每一個值的和爲1。學習
\(\sigma(\dot)\)支持策略\(s_i\)(\(s_i\) is in the support of \(\sigma(\dot)\))
給定一個玩家i的混合策略\(\sigma(\dot)\),若是\(\sigma(s_i) > 0\),則稱\(\sigma(\dot)\)支持純策略\(s_i\)。ui
連續策略集的混合策略
玩家i的純策略集合\(S_i\)是一個值區間,則玩家i的一個混合策略是累積分佈函數\(F_i : S_i \to [0, 1], \ where \ F_i(x) = Pr{s_i < x>}\)。
若是\(F_i(\dot)\)在密度\(f_i(\dot)\)上可微分,而且\(f_i(\dot) > 0\),則稱\(F_i(\dot)\)支持純策略\(s_i\)。spa
信念(belief)
信念\(\pi_i \in \Delta S_{-i}\)表明玩家i認爲對手採用\(s_{-i} \in S_{-i}\)的機率。htm
指望收益(Expected Payoffs)
玩家i選擇策略\(s_i \in S_i\),而且對手選擇混合策略\(\sigma_{-i} \ \Delta_{-i}\),的指望收益:
\[ v_i(s_i, \sigma_{-i}) = \sum_{s_{-i} \in S_{-i}} \sigma_{-i}(s_{-i}) v_i(s_i, s_{-i}) \]
玩家i選擇混合策略\(\sigma_i \in \Delta S_i\),而且對手選擇混合策略\(\sigma_{-i} \ \Delta_{-i}\),的指望收益:
\[ v_i(\sigma_i, \sigma_{-i}) = \sum_{s_{i} \in S_{i}} \sigma_{i}(s_{i}) v_i(s_i, s_{-i}) = \sum_{s_i \in S_i} ( \sum_{s_{-i} \in S_{-i}} \sigma_{i}(s_{i}) \sigma_{-i}(s_{i-}) v_i(s_i, s_{-i}) ) \]blog
混合策略的納什均衡
混合策略組合\(\sigma^* = (\sigma_1^*, \sigma_2^*, \cdots, \sigma_n^*)\)是一個納什策略,若是對於每一個玩家\(\sigma_i^*\)都是最佳響應。
\[ v_i(\sigma_i^*, \sigma_{-i}^*) \geq v_i(\sigma_i, \sigma_{-i}^*), \ \forall \sigma_i \in \Delta S_i \]ci
推論 6.1rem
若是\(\sigma^*\)是一個納什博弈,而且\(\sigma^*支持\)s_i\(和\)s'_i$,則
\(v_i(s_i, \sigma_{-i}^*) = v_i(s'_i, \sigma_{-i}^*) = v_i(\sigma^*, \sigma_{-i}^*)\)get
斷言 6.1:
若是一個玩家選擇純策略,另外一個玩家選擇混合策略,則不存在納什均衡。
斷言 6.2:
若是至少有一個玩家選擇只有兩個純策略的混合策略,則不存在納什均衡。
嚴格劣勢
\(s'_i \in S_i\)嚴格劣勢於\(\sigma_i \in \Delta S_i\),若是知足條件:
\[ v_i(\sigma_i, s_{-i}) > v_i(s'_i, s_{-i}), \ \forall s_{-i} \in S_{-i} \\ \]
不多是一個最佳響應
對於玩家i的混合策略\(\sigma_i \in \Delta S_i\),這個混合策略做爲最佳響應的對手混合策略\(\sigma_i \in BR_i(\sigma_{-1})\),若是對手的任何混合策略\(\sigma_{-1} \in \Delta S_{-i}\)都不在玩家i的信念中,則\(\sigma_i \in \Delta S_i\)不多是一個最佳響應。
斷言
一個劣勢混合策略\(sigma_i\)不多是一個最佳響應。
推論 6.2
任何兩人博弈中,策略\(sigma_i\)是一個嚴格劣勢純策略,當且僅當策略\(sigma_i\)不多是一個最佳響應。
納什存在定理(Nash's existence Theorem)
任何普通形式、具備限策略集合的博弈存在一個納什均衡的混合策略。
納什存在定理的證實用到了不動點定理。
布勞威爾不動點定理(Brouwer's Fixed-Point Theorem)
若是f(x)是一個連續函數從域[0, 1]到[0, 1]\(f:[0, 1] \to [0, 1]\),則存在至少一個點\(f(x^*) = x^*, x^* \in [0, 1]\)。
證實過程簡介:連續函數f(x)必定和函數\(f_1(x) = x\)至少有一個交點。
角谷不動點定理(Kakutani Fixed-Point Theorem)
一個對應\(C: X \rightrightarrows X\)有一個不動點,若是如下四個條件都知足:
- X是非空的,緊湊的,\(\mathbb{R}^n\)的凸子集
- C(x)對於全部的x都非空。
- C(x)對於全部的x都是凸的。
- C有一個閉合圖。