本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
協議是多方對一個剩餘(surplus),經過提議,嘗試達成一致意見。學習
一個兩人協議博弈的過程:ui
協議博弈和以前博弈的不一樣之處:spa
take it or leave it.
推論:11.1htm
在一個T=1的協議博弈中,剩餘的任何分配都能被支持爲一個納什博弈:\(x^* \in [0, 1], (v_1, v_2) = (x^*, 1 - x^*)\).
推論:11.2
在一個T=1的協議博弈中,容許一個惟一的子博弈精煉均衡,在這個均衡中,玩家1提供\(x=1\),而且玩家2接受任何\(x \leq 1\)。blog
推論:11.3ip
任何子博弈精煉均衡一定致使玩家們能夠在第一回合達成一致。
兩人奇數回合的協議博弈的結果
\[ v_1^* = x_1 = \frac{1 + \delta^T}{1 + \delta} \ and \ v_2^* = (1 - x_1) = \frac{\delta - \delta^T}{1 + \delta} \\ \lim_{T \to \infty} v_1^* = \lim_{T \to \infty} \frac{1 + \delta^T}{1 + \delta} = \frac{1}{ 1 + \delta} \\ \lim_{T \to \infty} v_2^* = \lim_{T \to \infty} \frac{\delta - \delta^T}{1 + \delta} = \frac{\delta}{1 + \delta} \\ \lim_{\delta \to 1} \lim_{T \to \infty} v_1^* = \lim_{\delta \to 1} \frac{1}{1 + \delta} = \frac{1}{2} \\ \lim_{\delta \to 1} \lim_{T \to \infty} v_2^* = \lim_{\delta \to 1} \frac{\delta}{1 + \delta} = \frac{1}{2} \\ \]get
說明了it
兩人無限回合的協議博弈的結果
\[ \overline{v}_1 = \overline{v}_2 = \overline{v} \\ \underline{v}_1 = \underline{v}_2 = \underline{v} \\ \underline{v} = 1 - \delta \overline{v} \\ \overline{v} = 1 - \delta \underline{v} \\ \underline{v} = \overline{v} = \frac{1}{1 + \delta} \\ where \\ \overline{v} \text{ : the best subgame-perfect equilibrium} \\ \underline{v} \text{ : the worst subgame-perfect equilibrium} \\ \]io
博弈規則:
有N奇數個玩家,須要\(\frac{N+1}{2}\)個接受才能是提議經過。
在每一個週期裏,每一個玩家都有相同的可能性稱爲提議者。
博弈結果:
\[ where \\ k \text{ : the proposer's best response} \\ v \text{ : the expected payoff for any player i} \]
提議者的最佳收益:須要獲得n-1的人的贊成,因爲折扣優點,這個n-1我的的收益爲\(\delta v\):
\[ k = 1 - \frac{N - 1}{2} \delta v \\ \]
迴應者的收益:有\(\frac{1}{N}\)可能性成爲提議者,拿到k;
有\(\frac{N - 1}{N}\)的可能性成爲迴應者,而且只有\(\frac{1}{2}\)的可能性(由於提議者只提供收益給迴應者中的一半人)拿到\(\delta v\)。
\[ v = \frac{k}{N} + \frac{N - 1}{2N} \delta v \\ \]
計算結果:
\[ v = \frac{1}{N} \\ k(N) = 1 - \delta ( \frac{N - 1}{2N}) \\ \]
說明了
博弈規則:
有N奇數個玩家。
提議者提出一個協議,
有一個修訂者提出一個修改協議。
若是提議者的協議經過了\(\frac{N+1}{2}\)。則被接受。
不然,修改協議變成主協議。
一個新的修訂者提出一個修改協議。
再次投票,重複上面的過程。
不管那個響應者成爲修訂者,均可經過的方案。
案例:3個玩家。
\[ where \\ k \text{ : the proposer's best response} \\ v(k) \text{ : the expected payoff for any player i} \]
迴應者的收益:一方面爲\(\frac{1 - k}{2}\),一方面爲\(\delta v(k)\):
\[ \frac{1 - k}{2} = \delta v(k) \\ \]
修訂者的收益:因爲對稱性,修訂者的給本身的收益\(v(k)\)應該是k。
\[ v(k) = k \\ \]
計算結果:
\[ k = \frac{1}{1 + 2 \delta} \\ \]
說明了
冒一個部分響應者不會成爲修訂者的風險。
\[ where \\ k \text{ : the proposer's value to himself} \\ v(k) \text{ : the expected payoff for proposer} \\ v(0) \text{ : the expected payoff for the player who will be offered 0} \]
迴應者的收益:一方面爲\(1 - k\),一方面爲\(\delta v(k)\):
\[ 1 - k = \delta v(k) \]
提議者的指望收益:有\(\frac{1}{2}\)可能性拿到k;若是冒險失敗,有\(\frac{1}{2}\)可能性拿到v(0)。
\[ v(k) = \frac{1}{2} k + \frac{1}{2} \delta v(0) \\ \]
獲得0的玩家的指望收益:有一半的可能性獲得v(k)。
\[ v(0) = \frac{1}{2} \delta v(k) \\ \]
計算結果:
\[ k = \frac{4 - \delta^2}{4 + 2 \delta - \delta^2} \\ v(k) = \frac{2}{4 + 2 \delta - \delta^2} \\ \]
說明了