讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識

理性和公共知識

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html

純策略中的優點(dominance)

  • 數學表達: 除了玩家i之外全部玩家的策略集合

\[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots S_n \\ s = (s_1, s_2, \cdots, s_n) \\ s_{-i} = (s_1, s_2, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) \\ s = (s_i, s_{-i}) \]
\(S\): 全部人的全部策略組合。
\(S_{-i}\): 除了玩家\(i\)之外,全部人的全部策略組合。
\(s\): 全部人的一種策略組合。
\(s_{-i}\): 除了玩家\(i\)之外,全部人的一種策略組合。
引進\(S_{-i}\)\(s_{-i}\)是爲了dom

  1. 經過看玩家i之外的全部玩家的策略,來考慮玩家i的策略。
  2. 或者專門看玩家i策略。

劣勢(被支配)策略(Dominated Strategies)

  • 定義 4.1:嚴格劣勢於
    對於玩家i,策略\(s'_i\)嚴格劣勢於\(s_i\),則:

\[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), \forall s_{-i} \in S_{-i} \]函數

斷言 4.1學習

一個理性玩家不會選擇一個嚴格劣勢策略。ui

優點策略(Dominant Strategies)

  • 定義 4.2: 嚴格優點策略(strictly dominant strategy)
    策略\(s_i \in S_i\)是一個嚴格優點策略,若是玩家i的任何其它策略都嚴格劣勢於\(s_i\)

\[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), \forall s'_i \in S_i, s'_i \neq s_i, and \ \forall s_{-i} \in S_{-i} \]spa

  • 定義 4.3: 嚴格優點策略均衡(strictly dominant strategy equilibrium)
    策略組合\(s^D \in S_i\)是一個嚴格優點策略均衡,若是其中每個玩家i的策略都是嚴格優點策略。

\[ s_i \equiv s_i^D, \forall i \in N \]htm

推論 4.1blog

若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優點策略均衡\(s^D\),則\(s^D\)是惟一的嚴格優點策略均衡。get

斷言 4.2數學

若是有的話,玩家必定會選擇優點策略。

策略,策略集合,策略組合和策略均衡

  • 策略(strategy)
    \(s_i\)是玩家的一個策略。

  • 策略集合(strategy set)
    \(S_i\)是玩家的全部策略集合。\(s_i \in S_i\)
    \(S\)是全部玩家的全部策略的組合的集合。

  • 策略組合(strategy profile)
    \(s\)是N個玩家的一種策略組合。\(s = (s_1, s_2, \cdots, s_n), s \in S\)

  • 策略均衡(strategy equilibrium)
    \(s\)是任何一種致使合理結果的策略組合。

方法:嚴格劣勢策略的迭代消除

博弈論方法就是一個尋找均衡的過程。
方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本邏輯:

一個理性玩家不會選擇一個嚴格劣勢策略。
若是有的話,玩家必定會選擇優點策略。
過程:略

  • 迭代消除均衡(Iterated elimination equilibrium)
    嚴格劣勢策略的迭代消除(IESDS)過程當中倖存下來的博弈組合\(s^{ES}\)

推論 4.2

若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)\(s^*\)是一個嚴格優點策略均衡,則\(S^*\)是惟一的嚴格劣勢策略的迭代消除(IESDS)均衡。

信念(Beliefs),最佳響應(Best Response)和可合理化(Rationalizability)

在已經學習的兩個方法嚴格優點策略和嚴格劣勢策略的迭代消除(IESDS)以外的狀況下,若是玩家i的一個策略\(s_i\)不是一個嚴格劣勢策略,那就意味着在必定條件下(對手的某些策略下),策略\(s_i\)是一個合理的響應。

  • 最佳響應(best response)
    玩家i的策略\(s_i \in S_i\)是對手策略\(s_{-i} \in S_{-i}\)的最佳響應,則:
    \[ v_i(s_i, s_{-i}) \geq v_i(s'_i, s_{-i}), \forall s'_i \in S_i \]

  • 信念(belief)
    一個玩家i的信念就是一個他對手們的可能策略組合\(s_{-i} \in S_{-i}\)

  • 最佳響應對應(best-response correspondence)
    最佳響應對應\(BR_i(s_{-i})\),是玩家i,在他的對手們的策略組合\(s_{-i}\)上的全部可能最佳響應的集合。
    \(BR_i(s_{-i})\)能夠認爲是一個函數,其結果是一個集合。

  • 不是一個最佳響應(never a best response)
    玩家i,對於他的對手們的策略組合\(s_{-i}\)的最佳響應集合\(BR_i(s_{-i})\),若是\(s_{-i}\)不是在信任集合裏,則\(s_i \in BR_i(s_{-i})\)都不是最佳響應。

總結

方法

  • 嚴格優點策略
  • 嚴格劣勢策略的迭代消除(IESDS)
  • 去掉不可信的策略組合(或者保留可信的策略組合)。

推論 4.1

若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優點策略均衡\(s^D\),則\(s^D\)是惟一的嚴格優點策略均衡。

推論 4.2

若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)\(s^*\)是一個嚴格優點策略博弈,則\(S^*\)是惟一的嚴格劣勢策略的迭代消除(IESDS)均衡。

推論 4.3

對於玩家i,一個嚴格劣勢策略\(s_i\),不多是任何\(s_{-i} \in S_{-i}\)的最佳響應。

推論 4.4

在一個有限普通形式的博弈中,\(s^*\)是一個嚴格優點策略,或者是一個惟一的嚴格劣勢策略的迭代消除(IESDS)均衡,
則s_i^*是一個對於任何\(s_{-i} \in S_{-i}\)的最佳響應。

斷言 4.1

一個理性玩家不會選擇一個嚴格劣勢策略。

斷言

若是有的話,玩家必定會選擇優點策略。

斷言 4.2

一個理性玩家,在認爲他的對手選擇策略\(s_{-i} \in S_{-i}\)時,總會選擇\(s_{-i}\)的最想響應。

斷言

一個理性玩家只會選擇(他對手們的策略組合的)最佳響應。

參照

相關文章
相關標籤/搜索