本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html
序貫理性就是要求玩家老是選擇最佳反應。
子博弈精煉是要求玩家在每一個信息集上老是選擇最佳反應。node
在均衡路徑上(on the equilibrium path), 不在均衡路徑上(off the equilibrium path)
\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個不完整信息博弈的貝葉斯納什均衡。
咱們說一個信息集在均衡路徑上(on the equilibrium path),若是給定的\(\sigma^*\)和類型分佈,這個信息集有正可能性到達。
咱們說一個信息集不在均衡路徑上(off the equilibrium path),若是給定的\(\sigma^*\)和類型分佈,這個信息集被到達的可能性爲0。學習
信念體系
一個信念體系\(\mu\),在一個擴展形式博弈中,給每一個信息集的每一個決策點(decision node)都分配了一個機率。
\[ \mu(x) \in [0, 1] \\ \sum_{x \in h} \mu(x) = 1, \forall h \in H \]ui
貝葉斯規則(Bayes' Rule)
\(\Pr \{A|B \} = \frac{\Pr \{A \land B \} }{\Pr \{A \land B \} + \Pr \{\lnot A \land B \}}\)spa
精煉貝葉斯均衡(perfect Bayesian equilibrium)的四個需求:設計
需求 15.4
給定玩家的信念,玩家的策略必須是序貫理性。也就是說在每個信息集上,玩家將選擇信念對應的最佳反應。orm
精煉貝葉斯均衡(perfect Bayesian equilibrium)
若是知足需求15.1 ~ 15.4, 一個貝葉斯納什均衡\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一個信念體系\(\mu^*\)構成一個精煉貝葉斯均衡。htm
精煉貝葉斯均衡也是貝葉斯納什均衡和子博弈精煉均衡。blog
推論 15.1
一個(多是混合的)策略組合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個貝葉斯博弈\(\Gamma\)的貝葉斯納什均衡,
若是策略組合\(\sigma^*\)能使全部的信息集都有具備可能性到達,
則策略組合\(\sigma^*\)和(從這個策略組合\(\sigma^*\)和類型的機率分佈得到的)信仰系統\(\mu^*\)一塊兒,
就構成了一個精煉貝葉斯均衡(perfect Bayesian equilibrium)。ip
解釋:
這裏的意思是:策略組合和信念體系能夠互相迭代求解(也能夠理解爲一個序貫均衡的求解方式)
策略應該簡單地最大化每一個信息集的預期收益。
那些在策略中獲得正機率的信息集合的合理信念,應該是信息集合節點上的條件機率分佈(根據貝葉斯規則)。
解釋:
序貫均衡是一個精煉貝葉斯均衡。
而一個精煉貝葉斯均衡的策略組合和信念體系是一致的(根據一致性推導所得),這個精煉貝葉斯均衡纔是一個序貫均衡。
序貫均衡因爲難以應用,較少被使用。