本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
這裏討論的問題是:玩家1是信息提供者,玩家2是決策者。 玩家1和玩家2的收益函數有一個誤差。着致使玩家1並不必定會提供真實的信息。 而玩家2則須要根據玩家1的類型來作出決策。函數
三個結論:學習
- 不存在徹底誠實的均衡。(或者能夠理解爲存在一個不誠實的均衡。)
- 老是存在一個瞎說的均衡(babbling equilibrium)。玩家1沒有提供任何有用的信息,玩家2使用先驗信念來計算其最大收益。
- 若是玩家1的誤差不是太大,則在均衡中部分信息可以被真實傳遞。
案例: 玩家1瞭解真實的狀況,$\theta \in [0, 1]$爲兩個值中之一。 玩家2的先驗知識是這兩種狀態的可能性同樣。 玩家2的行動$a_2 \in \mathbb{R}$,其收益函數爲$v_2(a_2, \theta) = -(\theta - a_2)^2$,意味着玩家2的最優策略是$a_2 = \theta$。 玩家1的行動$a_1$,其收益函數爲$v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0$,意味着玩家2的最優策略是$a_2 = \theta + b$。 事件的順序爲:玩家1給玩家2一個消息,而後玩家2決定其策略。ui
這裏增長了一個條件:玩家1只能提供兩個信息$a \in { a', a'' }, 0 \leq a' < a'' \leq 1.$中的一個。spa
聲明 18.5設計
在一個兩消息均衡中,玩家1必定會使用一個閥值策略:若是$0 \leq \theta \leq \theta^$時選擇$a'$,若是$\theta^ \leq \theta \leq 1$時選擇$a''$。orm
聲明 18.6htm
在一個兩消息均衡中,玩家1使用一個閥值策略,則玩家2最佳反應$a_2(a'_1) = \frac{\theta^}{2}$和$a_2(a''_1) = \frac{1 - \theta^}{2}$。blog
聲明 18.7事件
當且僅當$b < \frac{1}{4}$時,存在一個兩消息精煉貝葉斯均衡。
案例: 在一個委員會中,玩家1是一個顧問,提供建議給政策制定者。玩家2制定政策。 玩家1瞭解真實的狀況,$\theta \in { -w, w}, w > 0$爲兩個值中之一。 玩家2的先驗知識是這兩種狀態的可能性同樣。 玩家2的行動$a_2$,其收益函數爲$v_2(a_2, \theta) = -(\theta - a_2)^2$,意味着玩家2的最優策略是$a_2 = \theta$。 玩家1的行動$a_1$,其收益函數爲$v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0$,意味着玩家2的最優策略是$a_2 = \theta + b$。 事件的順序爲:玩家1給玩家2一個消息,而後政策被指定。
解決方案1: 若是玩家2根據先驗條件,則會獲得$a_2 = 0$爲最大收益的行動。根據$a_2 = 0$行動指定的策略,稱之爲現狀策略(status quo policy)。 咱們能夠理解爲玩家2沒有從玩家1那裏獲得任何信息。
替代規則
聲明 18.8
在一個開放規則中,當且僅當$b \leq w$時,存在一個徹底誠實的均衡,其中$a_2 = \theta$。
聲明 18.9
在一個封閉規則中,當且僅當$b \leq w$時,存在一個徹底誠實的均衡,其中$a_2 = \theta + b$。
聲明 18.10
在一個封閉規則中,當且僅當$b \leq 2w$時,存在一個徹底誠實的均衡,其中$a_2 = \theta + w$。
結論: