本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
推論 10.1學習
若是有限重複博弈的階段博弈有一個惟一的納什博弈, 則這個有限重複博弈有一個惟一的子博弈精煉均衡。ui
現值(present value) 在一個無限隊列的收益$ { v_i }{i=1}^{\infty}$中,玩家i的現值是 $$ v_i = \sum{t=1}^{\infty} \delta^{t-1} v_i^t \ where \ 0 < \delta < 1 $$spa
平均收益(average payoff) 在一個無限隊列的收益$ { v_i }{i=1}^{\infty}$中,玩家i的現值是 $$ \bar{v_i} = (1 - \delta) \sum{t=1}^{\infty} \delta^{t-1} v_i^t \ where \ \delta < 1 $$htm
策略 在一個無限重複博弈中,$H_t$表明長度爲t的全部可能歷史的集合。 $h_t \in H_t$是一種歷史。 $H = \cup_{t=1}^{\infty} H_t$爲全部可能歷史的集合。 玩家i的一個純策略是一個映射$s_i: H \to S_i$,映射歷史到這個階段博弈的行動。 玩家i的一個行爲策略一個映射$\sigma_i: H \to \Delta S_i$,映射歷史到這個階段博弈的行動的隨機選擇。blog
子博弈精煉均衡(Sub-game-perfect equilibria) 一個純博弈組合$(s_1^(\cdot), s_2^(\cdot), \cdots, s_n^(\cdot)), s_i: H \to S_i, \forall i \in N$是一個子博弈精煉均衡, 若是在每個子博弈中,$(s_1^(\cdot), s_2^(\cdot), \cdots, s_n^(\cdot))$的約束都是一個納什均衡。隊列
推論 10.2rem
一個無限重複博弈$G(\delta), \delta < 1$,其階段博弈G的一個(靜態)納什均衡$(\sigma_1^, \sigma_2^, \cdots, \sigma_n^)$。 定義這個重複博弈的每一個玩家i的策略爲不依賴歷史的納什策略,$\sigma_i^(h) = \sigma_i^, \forall h \in H$, 則$(\sigma_1^(h), \sigma_2^(h), \cdots, \sigma_n^(h))$爲這個重複博弈的一個子博弈精煉均衡。get
不依賴歷史的無限重複博弈中階段博弈,其納什均衡就是重複博弈的子博弈精煉均衡。it
推論 10.3
在一個無限重複博弈$G(\delta)$中,一個策略組合是一個子博弈精煉均衡, 當且僅當不存在玩家i在其單個歷史$h_{t-1}$中,能夠從$s_i(h_{t-1})$偏離中得到更多的收益。
凸組合(convex combination) 給定兩個矢量$v = (v_1, v_2, \cdots, v_n)$和$v’ = (v‘_1, v’_2, \cdots, v‘_n)$, $\hat{v} = (\hat{v}_1, \hat{v}_2, \cdots, \hat{v}_n)$是一個凸組合(convex combination), 若是$\hat{v} = \alpha v + (1 - \alpha) \hat{v}, \alpha \in [0, 1]$或者說$\hat{v}_i = \alpha v_i + (1 - \alpha) \hat{v}_i, \forall i \in [1, \cdots, n]$ 從幾何上說凸組合位於兩個點之間線段上的任意點。
凸包(convex hull) 給定一組矢量$V = {v^1, v^2, \cdots, v^k }$,則V的凸包(convex hull)爲: $$ CoHull(V) = { \ v = \sum_{j=1}^k \alpha_j v^j \ where \ v \in \mathbb{R}^n, \ \exists (\alpha_1, \cdots, \alpha_k) \in R_+^n, \ \sum_{j=1}^k \alpha_j = 1\ } $$
幾何上的理解爲: 當n = 2(矢量的維度是2)時, 兩個點的凸包就是兩個點之間線段; 多個點的凸包就是多個點之間組成的平面; 當n > 2(矢量的維度 > 2)時, 兩個點的凸包就是兩個點之間線段; 多個點的凸包就是多個點之間組成的多維空間(維度爲$m \leq n \ \land \ m \leq k - 1$)。
大衆定理(the folk theorem)
$G(\delta)$爲一個有限,同時選擇的完整信息博弈, $v^* = (v_1^, \cdots, v_n^)$爲博弈G的一個納什均衡的收益,也是G的可行收益。 若是存在$v_i > v_i^*, \forall i \in N, \delta$爲一個足夠接近1的值, 則對於$G(\delta)$的無限重複博弈,存在一個子博弈精煉均衡,其平均收益接近於$v = (v_1, \cdots, v_n)$。
大衆定理因爲是多人貢獻,也搞不清是那些人,而得名。