本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
推論 10.1學習
若是有限重複博弈的階段博弈有一個惟一的納什博弈,
則這個有限重複博弈有一個惟一的子博弈精煉均衡。ui
現值(present value)
在一個無限隊列的收益$ { v_i }_{i=1}^{\infty}$中,玩家i的現值是
\[ v_i = \sum_{t=1}^{\infty} \delta^{t-1} v_i^t \\ where \\ 0 < \delta < 1 \]spa
平均收益(average payoff)
在一個無限隊列的收益$ { v_i }_{i=1}^{\infty}$中,玩家i的現值是
\[ \bar{v_i} = (1 - \delta) \sum_{t=1}^{\infty} \delta^{t-1} v_i^t \\ where \\ \delta < 1 \]htm
策略
在一個無限重複博弈中,\(H_t\)表明長度爲t的全部可能歷史的集合。
\(h_t \in H_t\)是一種歷史。
\(H = \cup_{t=1}^{\infty} H_t\)爲全部可能歷史的集合。
玩家i的一個純策略是一個映射\(s_i: H \to S_i\),映射歷史到這個階段博弈的行動。
玩家i的一個行爲策略一個映射\(\sigma_i: H \to \Delta S_i\),映射歷史到這個階段博弈的行動的隨機選擇。blog
子博弈精煉均衡(Sub-game-perfect equilibria)
一個純博弈組合\((s_1^*(\cdot), s_2^*(\cdot), \cdots, s_n^*(\cdot)), s_i: H \to S_i, \forall i \in N\)是一個子博弈精煉均衡,
若是在每個子博弈中,\((s_1^*(\cdot), s_2^*(\cdot), \cdots, s_n^*(\cdot))\)的約束都是一個納什均衡。隊列
推論 10.2rem
一個無限重複博弈\(G(\delta), \delta < 1\),其階段博弈G的一個(靜態)納什均衡\((\sigma_1^*, \sigma_2^*, \cdots, \sigma_n^*)\)。
定義這個重複博弈的每一個玩家i的策略爲不依賴歷史的納什策略,\(\sigma_i^*(h) = \sigma_i^*, \forall h \in H\),
則\((\sigma_1^*(h), \sigma_2^*(h), \cdots, \sigma_n^*(h))\)爲這個重複博弈的一個子博弈精煉均衡。get
不依賴歷史的無限重複博弈中階段博弈,其納什均衡就是重複博弈的子博弈精煉均衡。it
推論 10.3
在一個無限重複博弈\(G(\delta)\)中,一個策略組合是一個子博弈精煉均衡,
當且僅當不存在玩家i在其單個歷史\(h_{t-1}\)中,能夠從\(s_i(h_{t-1})\)偏離中得到更多的收益。
凸組合(convex combination)
給定兩個矢量\(v = (v_1, v_2, \cdots, v_n)\)和\(v’ = (v‘_1, v’_2, \cdots, v‘_n)\),
\(\hat{v} = (\hat{v}_1, \hat{v}_2, \cdots, \hat{v}_n)\)是一個凸組合(convex combination),
若是\(\hat{v} = \alpha v + (1 - \alpha) \hat{v}, \alpha \in [0, 1]\)或者說\(\hat{v}_i = \alpha v_i + (1 - \alpha) \hat{v}_i, \forall i \in [1, \cdots, n]\)
從幾何上說凸組合位於兩個點之間線段上的任意點。
凸包(convex hull)
給定一組矢量\(V = \{v^1, v^2, \cdots, v^k \}\),則V的凸包(convex hull)爲:
\[ CoHull(V) = \{ \\ v = \sum_{j=1}^k \alpha_j v^j \\ where \\ v \in \mathbb{R}^n, \\ \exists (\alpha_1, \cdots, \alpha_k) \in R_+^n, \\ \sum_{j=1}^k \alpha_j = 1\\ \} \]
幾何上的理解爲:
當n = 2(矢量的維度是2)時,
兩個點的凸包就是兩個點之間線段;
多個點的凸包就是多個點之間組成的平面;
當n > 2(矢量的維度 > 2)時,
兩個點的凸包就是兩個點之間線段;
多個點的凸包就是多個點之間組成的多維空間(維度爲\(m \leq n \ \land \ m \leq k - 1\))。
大衆定理(the folk theorem)
\(G(\delta)\)爲一個有限,同時選擇的完整信息博弈,
\(v^* = (v_1^*, \cdots, v_n^*)\)爲博弈G的一個納什均衡的收益,也是G的可行收益。
若是存在\(v_i > v_i^*, \forall i \in N, \delta\)爲一個足夠接近1的值,
則對於\(G(\delta)\)的無限重複博弈,存在一個子博弈精煉均衡,其平均收益接近於\(v = (v_1, \cdots, v_n)\)。
大衆定理因爲是多人貢獻,也搞不清是那些人,而得名。