本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
這裏討論的問題是:玩家1是信息提供者,玩家2是決策者。
玩家1和玩家2的收益函數有一個誤差。着致使玩家1並不必定會提供真實的信息。
而玩家2則須要根據玩家1的類型來作出決策。函數
三個結論:學習
- 不存在徹底誠實的均衡。(或者能夠理解爲存在一個不誠實的均衡。)
- 老是存在一個瞎說的均衡(babbling equilibrium)。玩家1沒有提供任何有用的信息,玩家2使用先驗信念來計算其最大收益。
- 若是玩家1的誤差不是太大,則在均衡中部分信息可以被真實傳遞。
案例:
玩家1瞭解真實的狀況,\(\theta \in [0, 1]\)爲兩個值中之一。
玩家2的先驗知識是這兩種狀態的可能性同樣。
玩家2的行動\(a_2 \in \mathbb{R}\),其收益函數爲\(v_2(a_2, \theta) = -(\theta - a_2)^2\),意味着玩家2的最優策略是\(a_2 = \theta\)。
玩家1的行動\(a_1\),其收益函數爲\(v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0\),意味着玩家2的最優策略是\(a_2 = \theta + b\)。
事件的順序爲:玩家1給玩家2一個消息,而後玩家2決定其策略。ui
這裏增長了一個條件:玩家1只能提供兩個信息\(a \in \{ a', a'' \}, 0 \leq a' < a'' \leq 1.\)中的一個。spa
聲明 18.5設計
在一個兩消息均衡中,玩家1必定會使用一個閥值策略:若是\(0 \leq \theta \leq \theta^*\)時選擇\(a'\),若是\(\theta^* \leq \theta \leq 1\)時選擇\(a''\)。orm
聲明 18.6htm
在一個兩消息均衡中,玩家1使用一個閥值策略,則玩家2最佳反應\(a_2(a'_1) = \frac{\theta^*}{2}\)和\(a_2(a''_1) = \frac{1 - \theta^*}{2}\)。blog
聲明 18.7事件
當且僅當\(b < \frac{1}{4}\)時,存在一個兩消息精煉貝葉斯均衡。
案例:
在一個委員會中,玩家1是一個顧問,提供建議給政策制定者。玩家2制定政策。
玩家1瞭解真實的狀況,\(\theta \in \{ -w, w\}, w > 0\)爲兩個值中之一。
玩家2的先驗知識是這兩種狀態的可能性同樣。
玩家2的行動\(a_2\),其收益函數爲\(v_2(a_2, \theta) = -(\theta - a_2)^2\),意味着玩家2的最優策略是\(a_2 = \theta\)。
玩家1的行動\(a_1\),其收益函數爲\(v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0\),意味着玩家2的最優策略是\(a_2 = \theta + b\)。
事件的順序爲:玩家1給玩家2一個消息,而後政策被指定。
解決方案1:
若是玩家2根據先驗條件,則會獲得\(a_2 = 0\)爲最大收益的行動。根據\(a_2 = 0\)行動指定的策略,稱之爲現狀策略(status quo policy)。
咱們能夠理解爲玩家2沒有從玩家1那裏獲得任何信息。
替代規則
聲明 18.8
在一個開放規則中,當且僅當\(b \leq w\)時,存在一個徹底誠實的均衡,其中\(a_2 = \theta\)。
聲明 18.9
在一個封閉規則中,當且僅當\(b \leq w\)時,存在一個徹底誠實的均衡,其中\(a_2 = \theta + b\)。
聲明 18.10
在一個封閉規則中,當且僅當\(b \leq 2w\)時,存在一個徹底誠實的均衡,其中\(a_2 = \theta + w\)。
結論: