本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
序貫理性(Sequential Rationality)
序貫理性是一個原則:在博弈樹的每個信息集上,玩家老是使用最佳策略。
這意味着,不管是否在均衡路徑上,博弈次序的每一個階段,玩家都是在作理智的選擇。學習
序貫理性(Sequential Rationality)
給定玩家i對手的策略組合\(\sigma_{-i} \in \Delta S_{-i}\),玩家策略\(\sigma_i\)是序貫理性的,
當且僅當玩家i在每一個信息集上,老是選擇\(\sigma_{-i}\)最佳響應。ui
方法 - 逆向概括法解:spa
從末端節點開始,在上一層的每一個節點的收益組合爲節點玩家的(子節點的)最佳收益組合。
以此類推,直到根節點。根節點上的收益組合(多是多個)的博弈路徑爲逆向概括法解。htm
推論8.1 (Zermelo's Theorem)blog
任何有限完美信息博弈都有一個逆向概括法解,並且是順序合理的。
此外,若是沒有兩個末端節點有(對每一個玩家)相同的收益,則逆向概括法解是惟一的。rem
推論get
任何有限完美信息博弈至少有一個順序合理的純策略形式的納什均衡。
此外,若是沒有兩個末端節點有(對每一個玩家)相同的收益,則有惟一的順序合理的納什均衡。it
適當的子博弈(proper subgame)
博弈\(\Gamma\)的一個適當子博弈\(G\)只包含一個節點和它全部子孫節點,並具備性質:
若是\(s \in G\)而且\(x' \in h(x)\),則\(x' \in G\) - 屬於子博弈\(G\)的節點,這個節點的信息集包含的全部節點都屬於這個子博弈\(G\)。io
子博弈精煉均衡(subgame-perfect (Nash) equilibrium)
在一個擴展形式博弈\(\Gamma\)中,若是對於每個子博弈\(G\),\(\sigma^*\)都是\(G\)中的納什均衡,則行爲策略組合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個子博弈精煉均衡。
事實
對於任何有限完美信息博弈,子博弈精煉納什均衡的集合和逆向概括法的納什均衡的集合是一致的。