《美麗心靈》,一部講數學家約翰·福布斯·納什的電影,我第一次聽到博弈理論就是在這部電影裏。看過電影以後就一直想知道,博弈論究竟講了什麼。好久以後,20190417這天,我刷JD的購物車湊單,看到了由張維迎老師著的《博弈與社會》一書,百度一番發現是本好書,擇書不如撞書,就它了。安全
這本書用了大量的例子來闡述博弈論對人類社會的理解。用張維迎老師的話說就是:「……我將使用博弈論(game theory)的方法從人際互動的角度來考察人的行爲」。張維迎老師在闡述博弈論方法論的地方還說到一個點,我以爲頗有意思:「實際上,全部的社會科學均可當作是有關人類行爲的科學,它們旨在揭示人類行爲的規律,特色和影響。固然,不一樣學科的視角,方法以及前提假設可能截然不同。在這些學科當中,有着鮮明特點的方法論的學科主要有三種:經濟學,社會學,心理學。」這表示,對人類行爲的研究基本就是架設在經濟學,社會學,心理學三個學科上,固然可能還有其餘一些旁的學科,這是我此前沒有意識到的一個點。工具
《社會與博弈》的內容至關豐富,有不少對社會史實的講解,感興趣的同窗應該入手一本本身閱讀一下,對我而言replay的價值在於記錄一些我認爲重要的,有意思的概念。因此我會從概念的角度出發,混合本身的理解和想法去寫。而更多更豐富的內容我也只能可望不可即啦。遊戲
不少理論都有基本假設,好比相對論假設真空中光速不變,博弈論則假設:數學
參與人是工具理性的產品
工具理性是全部參與人的共同知識入門
全部參與人都瞭解博弈的規則效率
這裏引出了另外一個概念:工具理性。工具理性指的是,一我的要有明確的偏好,並在給定條件下,必定追求偏好的最大知足。明確偏好也有定義:偏好要具備可比較性,以及傳遞性,才被認爲是明確偏好。好比你認爲桃子比蘋果好吃,蘋果比梨好吃,而且你認爲桃子比梨好吃,你的這個偏好纔是明確的。百度
工具理性是全部參與人的共同知識(簡稱:理性共識),能夠簡單的理解爲,我是理性的,而我知道你也是理性的。理性共識有階次的概念,好比零階,全部參與人都是理性的,可是不知道其餘人是否理性;一階,參與人知道其餘人是理性的;二階,參與人知道其餘人知道本身是理性的;以此類推到N階。方法
參與人都知道博弈規則,這個就是字面意思,你們都知道遊戲規則。時間
帕累托最優又稱帕累託效率,它是由意大利經濟學家帕累託在一百多年前提出的。帕累托最優指的是這樣一種社會狀態,沒有人能夠在不下降其餘人處境的前提下實現增加。帕累托最優比較僵硬,就算我實現了100的增加,而只形成了你1的倒退,那這個狀態也不是帕累托最優。
因爲帕累托最優的僵硬,卡爾多和希克斯提出了新的標準:受益者的所得若是能夠彌補受損者的損失,那它就是一個卡爾多——希克斯改進。
法律上有一個「漢德法則」,它就是卡爾多——希克斯改進的一種解釋。
完美信息指的是,你知道對手的一舉一動。好比下棋。
徹底信息指的是你掌握對方的特徵。好比你知道你的對手是一個剛入門的菜鳥。
參與人行動時,不知道對手採起了什麼行動。好比劃拳。
參與人行動時,知道對手採起了什麼行動。好比打牌。
這時若是有人提出了一個詞叫:徹底信息動態博弈。我想你就應該能理解是什麼意思了。
戰略這個詞,我常聽,但它的明肯定義,我仍是在這本書裏纔看到的,並且看到後我才知道,戰略是要規定時間的!書中這樣寫道:「戰略是行動的規則,它要爲行動規定時機……戰略要具備完備性,就是說針對全部可能的狀況,都要制定相應的行動計劃。」
通常參與人的最優選擇都會依賴其餘參與人的選擇,可是有些狀況下,無論你的對手選擇什麼,你都只有一個最優選擇,此時這個最優選擇就被叫作「佔優戰略」。
納什均衡指全部人都處在最優選擇上。不過不要把它和帕累托最優搞混。納什均衡下的參與人最優選擇是從參與人角度來看的,好比你我迎面走去,我認爲你會靠右行(我國的社會規範提倡靠右行走),因而我也選擇靠右行。而你也認爲我會靠右行,因而你也靠右行,因而我兩安全交會,誰也沒撞到誰,我是最優選擇,你也是最優選擇,此時我兩的選擇就組成了納什均衡。若是一個英國人迎面向我走來,我和他就沒法構成納什均衡。從這個例子你也能看出來,在一個場景下能夠有多個納什均衡,好比兩個英國人,都靠左走,這也是一個納什均衡。
書中描述了不少博弈,包括虛構的,真實的。這裏我將replay幾個重要的博弈。
「囚徒困境」是社會合做面臨的基本問題。包含了豐富的內容,幾乎全部的博弈理論都由此發展,能夠說咱們從始至終都要不斷地涉及它
可見囚徒困境博弈有多麼重要。囚徒困境是這樣的:
兩個犯罪嫌疑人共同做案,警察抓住了他們,分開拘押,他們能夠選擇坦白,或者不坦白;若是一我的坦白,另外一個不坦白;則坦白的一方將被當即釋放,不坦白的一方被判10年監禁;若是都坦白,則各判8年;若是都不坦白,則因證據不足,各判1年。
簡單分析一下,罪犯A不知道罪犯B是否坦白,那麼罪犯A應該選擇什麼?假設罪犯A不坦白,那麼罪犯B坦白,A將被關10年,罪犯B不坦白,A將被關1年;假設罪犯A坦白,那麼罪犯B坦白,A將被關8年,罪犯B不坦白,A將無罪釋放。因此A將面臨一個佔優戰略,那就是坦白!B的狀況是同樣的。問題出現了,這個博弈的帕累托最優是兩人都不坦白,這樣各關一年,我的理性和集體理性在這裏發生了衝突。這是博弈論研究的一個重要支點,現實社會中不少咱們嗤之以鼻的現象,就是我的理性與集體理性衝突致使的。
做者舉了幾個例子:
廣告,企業發廣告會下降本身的利潤,但若是別人發廣告,你不發,你就會由於失去市場份額而難以存活,因此你只能發廣告,這最終致使你們的利潤都下降,而集體理性的作法是你們都不發廣告。
又好比軍備競賽,軍備競賽會增長國家負擔,但若是你不發展軍事,你就會陷入危險境地,因此你只能加入軍備競賽,而集體理性的作法是你們都不發展軍事。
還有公共產品。公共產品指國防,道路,橋樑等等的公共服務或設施。與公共產品對應的是私人物品。私人物品具備排他性,你在穿的衣服其餘人就穿不了,而公共產品沒有排他性,你行駛的公路,其餘人也能夠行駛,因爲沒有排他性,人們更樂意去搭公共產品的便車,因而都沒有積極性去生產公共產品。所以公共產品的囚徒困境是公共治理的核心問題,對一個社會來講極其重要。
社會中人們簽定合同,預先擬定賠償方案,就是爲了走出囚徒困境,讓雙方合做成爲各自的最優選擇,增長合做雙方的合做意願。
智豬博弈是大豬小豬覓食問題,大豬去覓食,小豬蹭吃,那麼大豬收益4,小豬收益2;小豬覓食,大豬蹭吃,那麼小豬收益-1,大豬收益6;大小豬同時覓食,大豬收益5,小豬收益0;大小豬都不覓食,各自收益都爲0。你不用在乎這裏出現的數字,數字是多少無所謂,你只須要知道這樣一個核心道理:小豬覓食收益都很低,它最好的策略是蹭吃;而大豬雖然蹭吃有很高的收益,可若是小豬也不覓食,那它就一無所得,而大豬若是選擇覓食的話,不管小豬是否本身覓食,大豬的收益都不錯。
智豬博弈其實解釋了不少社會現象。好比村裏的大戶人家出資修路,修路能增長大戶人家的產能,因此他有這個意願。好比國際反恐,反恐成本是很高的,美國爲何在反恐問題上有那麼高的積極性,由於他在反恐中能得到收益,而小國也討厭恐怖分子,但他們沒有積極性。