在一次足球比賽罰點球時,罰球隊員能夠選擇L,M,R三種不一樣射門路徑;門將能夠選擇撲向左路或者右路(原則上講他也能夠守在右路)。ui
l | r | |
L | 4,-4 | 9,-9 |
M | 6,-6 | 6,-6 |
R | 9,-9 | 4,-4 |
該表表示各自的收益,其中,Lr對應的9表示當射手射向左路而門將撲向右路時,射手有90%的機率進球,-9表示門將有90%的機率丟球(10%機率射偏)。其餘收益以此類推。 咱們假設門將撲向右路的機率是Pr,那麼門將撲向左路的機率是Pl=1-Pr。 那麼,射手 選擇左路的預期收益爲 EU1(L,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*4 + Pr*9 = 4 + 5*Pr; 選擇中路的預期收益爲 EU1(M,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*6 + Pr*6 = 6; 選擇右路的預期收益爲 EU1(R,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*9 + Pr*4 = 9 - 5*Pr;
結論:從中路射門都不是一個最佳策略;不要選擇在任何信念下都不是最佳策略的策略。
定義:參與者i的對策si是對手的策略s-i的最佳對策,當且僅當對於參與者i的全部其餘策略si',U1(si,s-i)>=U1(si',s-i)spa
兩個參與者都是公司的股東,他們都持有公司的股份而且平分利潤。
si表示第i個股東爲公司付出的精力。i=1,2。
總收益爲4*(s1 + s2 + B*s1*s2)
因此對於每一個參與者,他們可以得到的收益是1/2*4*(s1 + s2 + B*s1*s2) = 2*(s1 + s2 + B*s1*s2)
咱們如今來考慮參與者1,他的付出是s1^2,s因此他的淨收益爲:2*(s1 + s2 + B*s1*s2) - s1^2
爲了讓收益最大,對s1求導得出收益導數爲0的方程:s1 = 1 + B*s2
同理,對於s2,s2 = 1 + B*s1
咱們這裏設B=1/4。S=[1,4]。blog
這裏看一看到,由於s1的範圍只在1和2之間,因此[0,1]和[3,4]是s1的劣勢策略; 同理,[0,1]和[3,4]是s2的劣勢策略。 因此剔除以後剩下了s1∈[1,2],s2∈[1,2]這個區間,咱們將其放大四倍,發現了和原來同樣的圖。 而後咱們就能夠接待進行剔除了。 最後獲得的點就是方程組: s1 = 1 + B*s2
s2 = 1 + B*s1
的解。 得出: s1 = s2 = 1/(B-1) (1/(B-1), 1/(B-1))這個點稱爲納什均衡 Nash Equilibrium
這意味着博弈雙方彼此都不想偏離納什均衡點。在納什均衡點處,雙方都採起彼此的最佳對策。ci