讀書筆記: 博弈論導論 - 09 - 完整信息的動態博弈 多階段博弈

讀書筆記: 博弈論導論 - 09 - 完整信息的動態博弈 多階段博弈

多階段博弈(Multistage Games)

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。html

多階段博弈

  • 多階段博弈
    多階段博弈是一個有限個數的普通形式階段博弈(stage-game)的隊列。每一個階段博弈(stage-game)是一個獨立的、非完美信息的完整博弈。
    這些階段博弈的玩家都相同。每一個博弈都屬於一段大相徑庭的時期(distinct period)。dom

  • 多階段博弈:收益 - 折扣累計和收益(discounted sum payoff)
    \[ v_i = v_i^1 + \delta^1 v_i^2 + \delta^2 v_i^3 + \cdots + \delta^{T-1} v_i^T = \sum_{t=1}^T \delta^{t-1} v_i^t \\ where \\ \delta \text{: discount rate} \]ide

  • 多階段博弈:策略
    「若是在博弈1,博弈2,。。。博弈t-1中發生了這些,我會在博弈 t 中採起行動a。」學習

  • 多階段博弈:條件純策略隊列(conditional pure strategies list)
    第t個階段的策略(的參數)是以前的發生的事件。
    \[ S_i = {s_i^1, s_i^2(h_1), \cdots, s_i^t(h_{t-1}), \cdots, s_i^T(h_{T-1})} \\ where \\ h_{t-1} \text{ : a particular outcome that occurred up to period t, not including period t. or information set} \\ s_i^t(h_{t-1}) \text { : an action for player i from the } t \text {th stage-game.} \\ h_{t-1} = ((a_1^1, \cdots, a_n^1), \cdots, (a_1^{t-1}, \cdots, a_n^{t-1})) \]spa

  • 多階段博弈:混合策略(mixed strategy)
    \[ \sigma_i = {\sigma_i^1, \sigma_i^2(h_1), \cdots, \sigma_i^t(h_{t-1}), \cdots, \sigma_i^T(h_{T-1})} \\ where \\ h_{t-1} \text{ : a particular outcome that occurred up to period t, not including period t. or information set} \\ \sigma_i^t(h_{t-1}) \text { : an randomization over player i's actions from the } t \text {th stage-game.} \\ \]orm

推論9.1htm

在一個T階段的多階段博弈中,\(\sigma^{t*}\)是第t個階段的一個納什均衡。
則在這個多階段博弈中存在一個子博弈精煉均衡,其均衡路徑一致於\(\sigma^{1*}, \sigma^{2*}, \cdots, \sigma^{T*}\)產生的路徑。blog

推論9.2隊列

在一個由階段博弈\(G_1, G_2, \cdots, G_T\)T組成的多階段博弈中,\(\sigma^*\)是一個納什均衡,
則在期間T(最後一個)的階段博弈中,\(\sigma^*\)的約束必定是這個階段博弈的納什均衡。事件

最後一個博弈不存在依賴性。
後面的博弈若是有多個納什均衡,則可能會影響前面階段的博弈結果。(胡蘿蔔大棒理論)

推論9.3

在一個由有限個階段博弈組成的多階段博弈中,每一個階段博弈都有一個惟一的納什均衡,
則這個多階段博弈有一個惟一的子博弈精煉均衡。

單階段誤差原理(The One-Stage Deviation Principle)

單階段誤差原理用來簡化有多個階段博弈的計算過程。

  • 單階段不可改善的策略(one-stage un-improvable strategy)
    一個策略是單階段不可改善的,若是不存在\(h_i, a \in A_i(h_i)\)
    \[ v_i(\sigma_i^{a,h_i}, h_i) > v_i(\sigma_i, h_i) \\ where \\ \sigma_i^{a,h_i} \text{: is identical to } \sigma_i \text{ everywhere except at } h_i. \]

定理:9.1

一個單階段不可改善的策略必定是最優的。

參照

相關文章
相關標籤/搜索