本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
\[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots S_n \\ s = (s_1, s_2, \cdots, s_n) \\ s_{-i} = (s_1, s_2, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) \\ s = (s_i, s_{-i}) \]
\(S\): 全部人的全部策略組合。
\(S_{-i}\): 除了玩家\(i\)之外,全部人的全部策略組合。
\(s\): 全部人的一種策略組合。
\(s_{-i}\): 除了玩家\(i\)之外,全部人的一種策略組合。
引進\(S_{-i}\)和\(s_{-i}\)是爲了dom
\[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), \forall s_{-i} \in S_{-i} \]函數
斷言 4.1學習
一個理性玩家不會選擇一個嚴格劣勢策略。ui
\[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), \forall s'_i \in S_i, s'_i \neq s_i, and \ \forall s_{-i} \in S_{-i} \]spa
\[ s_i \equiv s_i^D, \forall i \in N \]htm
推論 4.1blog
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優點策略均衡\(s^D\),則\(s^D\)是惟一的嚴格優點策略均衡。get
斷言 4.2數學
若是有的話,玩家必定會選擇優點策略。
策略(strategy)
\(s_i\)是玩家的一個策略。
策略集合(strategy set)
\(S_i\)是玩家的全部策略集合。\(s_i \in S_i\)
\(S\)是全部玩家的全部策略的組合的集合。
策略組合(strategy profile)
\(s\)是N個玩家的一種策略組合。\(s = (s_1, s_2, \cdots, s_n), s \in S\)
策略均衡(strategy equilibrium)
\(s\)是任何一種致使合理結果的策略組合。
博弈論方法就是一個尋找均衡的過程。
方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本邏輯:
一個理性玩家不會選擇一個嚴格劣勢策略。
若是有的話,玩家必定會選擇優點策略。
過程:略
推論 4.2
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一個嚴格優點策略均衡,則\(S^*\)是惟一的嚴格劣勢策略的迭代消除(IESDS)均衡。
在已經學習的兩個方法嚴格優點策略和嚴格劣勢策略的迭代消除(IESDS)以外的狀況下,若是玩家i的一個策略\(s_i\)不是一個嚴格劣勢策略,那就意味着在必定條件下(對手的某些策略下),策略\(s_i\)是一個合理的響應。
最佳響應(best response)
玩家i的策略\(s_i \in S_i\)是對手策略\(s_{-i} \in S_{-i}\)的最佳響應,則:
\[ v_i(s_i, s_{-i}) \geq v_i(s'_i, s_{-i}), \forall s'_i \in S_i \]
信念(belief)
一個玩家i的信念就是一個他對手們的可能策略組合\(s_{-i} \in S_{-i}\)。
最佳響應對應(best-response correspondence)
最佳響應對應\(BR_i(s_{-i})\),是玩家i,在他的對手們的策略組合\(s_{-i}\)上的全部可能最佳響應的集合。
\(BR_i(s_{-i})\)能夠認爲是一個函數,其結果是一個集合。
不是一個最佳響應(never a best response)
玩家i,對於他的對手們的策略組合\(s_{-i}\)的最佳響應集合\(BR_i(s_{-i})\),若是\(s_{-i}\)不是在信任集合裏,則\(s_i \in BR_i(s_{-i})\)都不是最佳響應。
方法
推論 4.1
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優點策略均衡\(s^D\),則\(s^D\)是惟一的嚴格優點策略均衡。
推論 4.2
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一個嚴格優點策略博弈,則\(S^*\)是惟一的嚴格劣勢策略的迭代消除(IESDS)均衡。
推論 4.3
對於玩家i,一個嚴格劣勢策略\(s_i\),不多是任何\(s_{-i} \in S_{-i}\)的最佳響應。
推論 4.4
在一個有限普通形式的博弈中,\(s^*\)是一個嚴格優點策略,或者是一個惟一的嚴格劣勢策略的迭代消除(IESDS)均衡,
則s_i^*是一個對於任何\(s_{-i} \in S_{-i}\)的最佳響應。
斷言 4.1
一個理性玩家不會選擇一個嚴格劣勢策略。
斷言
若是有的話,玩家必定會選擇優點策略。
斷言 4.2
一個理性玩家,在認爲他的對手選擇策略\(s_{-i} \in S_{-i}\)時,總會選擇\(s_{-i}\)的最想響應。
斷言
一個理性玩家只會選擇(他對手們的策略組合的)最佳響應。