1、經濟學上的「海盜分金」模型
假定「每人海盜都是絕頂聰明且很理智」,那麼「第一個海盜提出怎樣的分配方案纔可以使本身的收益最大化?」
推理過程是這樣的:
從後向前推,若是1至3號強盜都餵了鯊魚,只剩4號和5號的話,5號必定投反對票讓4號喂鯊魚,以獨吞所有金幣。因此,4號唯有支持3號才能保命。
3號知道這一點,就會提出「100,0,0」的分配方案,對4號、5號愛財如命而將所有金幣歸爲已有,由於他知道4號一無所得但仍是會投同意票,再加上本身一票,他的方案便可經過。
不過,2號推知3號的方案,就會提出「98,0,1,1」的方案,即放棄3號,而給予4號和5號各一枚金幣。因爲該方案對於4號和5號來講比在3號分配時更爲有利,他們將支持他而不但願他出局而由3號來分配。這樣,2號將拿走98枚金幣。
一樣,2號的方案也會被1號所洞悉,1號並將提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放棄2號,而給3號一枚金幣,同時給4號(或5號)2枚金幣。因爲1號的這一方案對於3號和4號(或5號)來講,相比2號分配時更優,他們將投1號的同意票,再加上1號本身的票,1號的方案可獲經過,97枚金幣可輕鬆落入囊中。這無疑是1號可以獲取最大收益的方案了!答案是:1號強盜分給3號1枚金幣,分給4號或5號強盜2枚,本身獨得97枚。分配方案可寫成(97,0,1,2,0)或(97,0,1,0,2)。
企業中的一把手,在搞內部人控制時,常常是拋開二號人物,而與會計和出納們打得火熱,就是由於公司裏的小人物好收買。
1號看起來最有可能喂鯊魚,但他緊緊地把握住先發優點,結果不但消除了死亡威脅,還收益最大。這不正是全球化過程當中先進國家的先發優點嗎?而5號,看起來最安全,沒有死亡的威脅,甚至還能坐收漁人之利,卻因不得不看別人臉色行事而只能分得一小杯羹。
不過,模型任意改變一個假設條件,最終結果都不同。而現實世界遠比模型複雜。
首先,現實中確定不會是人人都「絕對理性」。回到「海盜分金」的模型中,只要3號、4號或5號中有一我的偏離了絕對聰明的假設,海盜1號不管怎麼分均可能會被扔到海里去了。因此,1號首先要考慮的就是他的海盜兄弟們的聰明和理性究竟靠得住靠不住,不然先分者倒黴。
若是某人偏好看同夥被扔進海里喂鯊魚。果然如此,1號自覺得得意的方案豈不成了自掘墳墓!
再就是俗話所說的「人心隔肚皮」。因爲信息不對稱,謊話和虛假承諾就大有用武之地,而陰謀也會像雜草般瘋長,並藉機獲益。若是2號對三、四、5號大放煙幕彈,宣稱對於1號所提出任何分配方案,他必定會再多加上一個金幣給他們。這樣,結果又當如何?
一般,現實中人人都有自認的公平標準,於是時常會嘟嚷:「誰動了個人奶酪?」能夠料想,一旦1號所提方案和其所想的不符,就會有人大鬧……當你們都鬧起來的時候,1號能拿着97枚金幣毫髮無損、不慌不忙地走出去嗎?最大的可能就是,海盜們會要求修改規則,而後從新分配。想想二戰前的希特勒德國吧!
而假如由一次博弈變成重複博弈呢?好比,你們講清楚下次再得100枚金幣時,先由2號海盜來分……而後是3號……這很有點像美國總統選舉,輪流主政。說白了,實際上是民主形式下的分贓制。
最可怕的是其餘四人造成一個反1號的大聯盟並制定出新規則:四人平分金幣,將1號扔進大海……這就是阿Q式的革命理想:高舉平均主義的旗幟,將富人扔進死亡深淵……
制度規範行爲,理性打敗愚昧!
若是假設變爲,是10人分100枚金幣,投票50%或以上才能經過,不然他將被扔入大海喂鯊魚,依此類推。50%是問題的關鍵,海盜能夠投本身的票。所以若是剩下兩我的,不管什麼方案都會被經過,即100,0。
往上推一步,3我的時,倒數第三我的知道若是出現兩我的的狀況,所以它會團結第一我的,給他一個金幣
「往前推一步。如今加一個更兇猛的海盜P3。P1知道———P3知道他知道———若是P3的方案被否決了,遊戲就會只由P1和P2來繼續,而P1就一枚金幣也得不到。因此P3知道,只要給P1一枚金幣,P1就會贊成他的方案(固然,若是不給P1一枚金幣,P1反正什麼也得不到,寧肯投票讓P3去餵魚)。因此P3的最佳策略是:P1得1枚,P2什麼也得不到,P3得99枚。
P4的狀況差很少。他只要得兩票就能夠了,給P2一枚金幣就可讓他投票贊同這個方案,由於在接下來P3的方案中P2什麼也得不到。P5也是相同的推理方法只不過他要說服他的兩個同伴,因而他給每個在P4方案中什麼也得不到的P1和P3一枚金幣,本身留下98枚。
依此類推,最終P10的最佳方案是:他本身得96枚,給每個在P9方案中什麼也得不到的P二、P四、P6和P8一枚金幣。
結果,「海盜分金」最後的結果是P一、P二、P三、P四、P五、P六、P七、P八、P九、P10各能夠得到0、一、0、一、0、一、0、一、0、96枚金幣。
在「海盜分金」中,任何「分配者」想讓本身的方案得到經過的關鍵是,事先考慮清楚「挑戰者」的分配方案是什麼,並用最小的代價獲取最大收益,拉攏「挑戰者」分配方案中最不得意的人們。
真地是難以置信。P10看起來最有可能喂鯊魚,但他緊緊地把握住先發優點,結果不但消除了死亡威脅,還得到了最大收益。而P1,看起來最安全,沒有死亡的威脅,甚至還能坐收漁人之利,但卻因不得不看別人臉色行事,結果連一小杯羹都沒法分到,卻只可以保住性命而已。
世界圖書出版公司 」
2、最通常性、可隨意更改數據的解釋。
一、問題的提出: 5個海盜搶到了100顆寶石,每一顆都同樣的大小和價值連城。
他們決定這麼分:
1。抽籤決定本身的號碼(1,2,3,4,5)
2。首先,由1號提出分配方案,而後你們5人進行表決,當且超過半數或半數的人贊成時,按照他的提案進行分配,不然將被扔入大海喂鯊魚。
3。若是1號死後,再由2號提出分配方案,而後你們4人進行表決,當且僅當半數和超過半數的人贊成時,按照他的提案進行分配,不然將被扔入大海喂鯊魚。
4。以次類推......
條件:
每一個海盜都是很聰明的人,都能很理智的判斷得失,從而作出選擇。
問題:
第一個海盜提出怎樣的分配方案纔可以使本身的收益最大化
(若是在規則中加上下面一條會更加完善:海盜在本身的收益最大化的前提下樂意看到其餘海盜被扔入大海喂鯊魚。不加也說的過去,由於其餘海盜被扔入大海喂鯊魚符合每一個海盜的最大化利益。)
二、討論以下: 使用倒推法:
1、假設一、二、3號已被扔入海中,則4號的方案必爲100、0,且一定經過。故5號在獲得3號1個寶石的狀況下會堅定支持3號的方案。
2、3號的方案必爲9九、0、1,且一定經過。故4號在獲得2號1個寶石的狀況下會堅定支持2號的方案。
3、2號的方案必爲9九、0、一、0,且一定經過。2號不能把給4號的1個寶石給5號,5號未必堅決地支持2號的方案,由於3號一定經過的方案也能讓他獲得1個寶石。爲了萬無一失的保命,2號必須選4號,且一定經過。故3號、5號在各獲得1號1個寶石的狀況下會堅定支持1號的方案。
4、1號的方案必爲9八、0、一、0、1,且一定經過。
故答案是:98,0,1,0,1。
關於上述推理與網友討論一下: (1)對於上面推理中的:
「2、3號的方案必爲9九、0、1,且一定經過。故4號在獲得2號1個寶石的狀況下會堅定支持2號的方案。」
有網友認爲應修改成:
「2、3號的方案必爲9九、0、1,且一定經過。三號知道這一份寶石必須給五號,由於四號了爲要所有金幣確定要反對本身。
理由是:「二號已經死了,三號不會考慮四號支持二號的這個問題!」
(2)討論以下:
在制訂分金規則時,都「很聰明」「能很理智的判斷得失」的5名海盜經過上面的推理就已經都知道:按照分金規則,只要本身運氣好、抽到1 號,就能使本身的利益「合法地」最大化,即便抽不到1號,最壞的狀況是抽到2號或4號、分到0個寶石,決不會「被扔入大海喂鯊魚」。並且每一個海盜抽到1 號、「利益合法地最大化」的機會均等,這也正是5名海盜「都」贊成分金規則的根本緣由。
又由於5名海盜都「很聰明」「能很理智的判斷得失」,因此若是沒抽到1號,即便是運氣最差的抽到2號或4號、分到0個寶石的海盜,也都懂得遵照規則,由於他們知道若是不遵照規則,要求推倒重來、再製訂新的分金規則,一樣沒法保證在本身「利益合法地最大化」時、不會被運氣最差的其餘海盜要求推倒重來。這樣來回折騰下去,結果是:
①要麼不分寶石,每一個人永遠只有0個寶石。對運氣最差的海盜來講,還不如接受此分金規則的結果(即分0個寶石),由於分金規則被本身接受以後,分金規則從此繼續得以執行,本身之後還有「利益合法地最大化」的機會。對運氣好點的就更不用說了;
②要麼之內鬥的方式解決,進入「叢林法則」。那樣的結果可能就會更慘,由於對運氣最差的海盜來講,他沒法保證在內鬥時「被扔入大海喂鯊魚」的不是本身,除非他以爲本身有足夠的能力把其餘海盜扔入大海喂鯊魚,但那樣他們5個就不須要制訂分金規則了,就天然進入「叢林法則」了,會先「結盟生存」,最終「適者生存」。
(3)由以上推理可見:
①當海盜進行此推理時,5個海盜都還活者 ,並且這是他們第一次分金。
②此推理涉及到了「先有雞仍是先有蛋」的悖論。世上只因此既有了雞又有了蛋、此推理只因此沒有從「分金規則」異化爲「叢林法則」,在於:
雖然這是他們第一次分金,雖然他們都還不知道其餘海盜也都「很聰明」「能很理智的判斷得失」、在分金規則被5個海盜都贊成以前,他們在進行上面推理時都先假設了一、二、3號不「很聰明」、不「能很理智的判斷得失」,但當分金規則被5個海盜都贊成的那一刻,5個海盜都明白了其餘海盜也都「很聰明」「能很理智的判斷得失」(正所謂英雄識英雄、英雄所見略同、惺惺相惜、「方信道,惺惺自古惜惺惺。」——《西廂記》),因而「分金規則」得以遵照、執行,並進入良性循環。
若是5個海盜中的某些海盜不一樣意「分金規則」,即有部分海盜不「很聰明」、不「能很理智的判斷得失」,會形成「分金規則」沒法得以執行,則將從「分金規則」異化到「叢林法則」的「結盟生存」階段,由一個聯盟消滅另外聯盟。生存下來的這個聯盟,其成員若都「很聰明」「能很理智的判斷得失」,則自動執行「分金規則」;若都不「很聰明」、不「能很理智的判斷得失」,則進入「叢林法則」的「適者生存」的階段;若部分「很聰明」「能很理智的判斷得失」、部分不「很聰明」、不「能很理智的判斷得失」,則再次進入「結盟生存」階段。
(4)對多方博弈的啓示:
①以何種方式博弈由短板決定。長板必須學習並採起短板的博弈方式。對長板來講,最理想的固然是與長板博弈了。但願這一天能早日在我國實現、在東亞或亞洲實現、在全球實現。那將是人類之福祉。
②宇宙法則造就萬物,妙趣橫生。對於「被扔入大海喂鯊魚」這條規則的設計,執行時是用不上的,但缺了這條卻不行。可見規則設計的重要性和妙處。
③此爲微軟試題。微軟視高盛爲最大對手,理由是高盛把人才都搶走了。
(5)推理過程具體以下:
推理①:
假設①:一、二、3號已被扔入海中,由4號分寶石。
由假設①推理出:
結論① :4號的方案必爲100、0,且一定經過。(故4號不可能被扔入海中,與假設①不矛盾)
推理②:(要用到推理①的結論)
假設②:一、2號已被扔入海中,由3號分寶石。
由結論①、假設② 推理出:
結論②: 3號進行「推理①」的推理,獲得結論①後,知道了:本身只需給5號多於0個寶石,即方案爲9九、0、1,其方案就一定經過。(故3號不可能被扔入海中,與假設②不矛盾,只要與假設②不矛盾就好了,與假設①沒有絲毫關係,由於它們是兩個互相獨立的推理。)
餘下的推理你們依次類推。
(6)經過上面清晰的推理路線,會發現:「假設①」只在「推理①」中有效,推理①與推理②是互相獨立的,明白了這點就茅塞頓開,不會再說:「二號已經死了,三號不會考慮四號支持二號的這個問題!」 並且推理②用不上「三號知道這一份寶石必須給五號,由於四號了爲要所有寶石確定要反對本身。」這個前提。它是多餘的。
三、本題可推廣以下: 有X(1=<X=<202)個海盜,100顆寶石,其它規則同上。
則1號海盜的最大化收益 Y =101-((X+1)/2所得數取整)。
(當X=201及X=202時,1號海盜的最大化收益爲0,但可保命。)
Z(2=<Z=<X)號海盜的收益:Z爲奇數時收益爲 1, Z爲偶數時收益爲 0 。
對於X>202時狀況,可先在X=500個的狀況下進行討論,而後再做推廣。
依然是使用倒推法。
203號海盜必須得到102張同意票,但他沒法用100個寶石收買到101名同夥的支持。所以,不管203號提出什麼樣的分配方案,他都註定會被扔到海里去餵魚。
204號海盜必須得到102張同意票,203號爲了能保住性命,就必須讓204號的方案經過,避免由203號本身來提出分配方案,因此不管204號海盜提出什麼樣的方案,均可以獲得203號的堅決支持。這樣204號海盜就能夠保命:他能夠獲得他本身的1票、203號的1票、以及用100個寶石收買到的100名同夥的同意票,恰好達到所需的半數支持。能從204號那裏得到1個寶石的海盜,必屬於按照202號海盜的方案將一無所得的那102名海盜之列。
205號海盜必須得到103張同意票,但他沒法用100個寶石收買到102名同夥的支持。所以,不管205提出什麼樣的分配方案,他都註定會被扔到海里去餵魚。
206號海盜必須得到103張同意票,他能夠獲得205號的堅決支持,但他沒法用100個寶石收買到101名同夥的支持。所以,不管206號提出什麼樣的分配方案,他都註定會被扔到海里去餵魚。
207號海盜必須得到104張同意票,他能夠獲得205號和206號的堅決支持,但他沒法用100個寶石收買到101名同夥的支持。所以,不管207號提出什麼樣的分配方案,他都註定會被扔到海里去餵魚。
208號海盜必須得到104張同意票,他能夠獲得205號、206號、207號的堅決支持,加上他本身1票以及收買的100票,使他得以保命。從208號那裏得到1個寶石的海盜,必屬於那些按照204號方案將一無所得的那104名海盜之列。
如今能夠看出一條新的、此後將一直有效的規律:那些方案能經過的海盜(他們的分配方案全都是把寶石用來收買100名同夥,本身連1個寶石都得不到)相隔的距離愈來愈遠,而在他們之間的海盜則不管提出什麼樣的方案都會被扔進海里。所以,爲了保命,他們必會投票支持排在他們前面的海盜提出的任何分配方案。得以免葬身魚腹的海盜包括20一、20二、20四、20八、21六、23二、26四、32八、456號,
即200+一、200+二、200+四、200+八、200+1六、200+3二、200+6四、200+12八、200+256。即
200+2的0次冪,200+2的1次冪,200+2的2次冪,200+2的3次冪,200+2的4次冪,200+2的5次冪,200+2的6次冪,200+2的7次冪,200+2的8次冪,
即其號碼等於200加2的某次冪。
四、對本題做更通常的推廣,以下: 有X個海盜,A 顆寶石,其它規則同上。
當X=<2A+2時,
則1號海盜的最大化收益 Y=A+1-((X+1)/2所得數取整)。
(當X=2A+1及X=2A+2時,1號海盜的最大化收益爲0,但可保命。)
Z號(2=<Z=<X)海盜的收益:Z爲奇數時收益爲 1, Z爲偶數時收益爲 0 。
當X>2A+2時,
若X=2A+2的B次冪,則1號海盜可保命,但無收益。其餘海盜的收益狀況由前面討論可知有規律,但海盜的編號不固定,對它們的表述省略。
若X不等於2A+2的某次冪,設B=b是能使(X>2A+2的B次冪)成立的最大B,則(X+1-(2A+2的b次冪))號海盜可保命,但無收益。以前的海盜都會被扔到海里去餵魚。以後的海盜的收益狀況由前面討論可知有規律,但海盜的編號不固定,對它們的表述省略。
五、其它
著名數學家和經濟學家,加利福尼亞州 帕洛阿爾託 的 Stephen M. Omohundro 在1998年對此類問題進行了解答。 本題是該類問題的一個具體題目: 微軟經典面試題------海盜分寶石,20分鐘給出答案便可得到年薪8萬美金的職位: 5個海盜搶到了100顆寶石,即 X=5,A=100。 此類問題體現出的多方博弈狀況下的生存哲學: 一、沒有永恆的朋友,只有永恆的利益。 二、在臨界點之下,以決策者的身份出場,冒最大的風險,獲得最大的利益。 三、在接近臨界點的地方,是收益分配最接近公平的地方。半數的人均勻地受益,另半數的人均勻地不受益。 四、越過臨界點以後,以決策者的身份出場,風險極大,甚至會將老本賠進去,而收益卻爲零,這是最糟的狀況,由於你們的收益都不高。這是一種不穩定的狀態,系統會經過自我調整向臨界點靠攏。 五、永遠都不可能發生全部人都有收益的狀況,任什麼時候候都有至少 一半或者接近一半 人無收益,除非只有1我的。 另外,若是邏輯推理沒有漏洞,那麼結論就一定站得住腳,即便它與你的直覺矛盾。