本文摘自《算法交易員:會賺錢的人工智能》算法
1961 年某個炎熱的夜晚,美國拉斯維加斯賭場裏有個男人正在玩「21點」,他的身後圍着數十名看客。雖然這個男人已經淡定地玩了整整 6 小時,但從他戴着的大黑框眼鏡和淋漓的汗水中仍是能夠一眼看出,他並非一個專業的賭徒。看客們在賭他還能夠堅持幾局。大部分人都認爲這我的堅持不了多久,立刻就要傾家蕩產了。由於他怎麼看都像是個賭場新人,在對本身特別不利的狀況下也不收手,反而繼續抓牌,卻在旁人看來頗有利的狀況下猶猶豫豫。鄰座一直觀察他的人們譏笑着開始了遊戲。無數玩家敗下陣來離開了座位,他卻依然堅守着陣地,一次次眼看着陷入絕境、立刻就要傾家蕩產,卻又一次次絕處逢生。圍觀的人們一邊饒有趣味地議論着這個男人的運氣極好,一邊關注他的戰況。然而,莊家始終以爲這個男人有些不一樣尋常,由於每當莊家以爲本身立刻就要贏的時候,這個男人都能扭轉乾坤,好像總有幸運女神眷顧着他似的。玩了 9 小時之後,這個男人終於站起身來,他只輸了 8 美圓。男人一邊小聲地自言自語「系統測試結束了」,一邊離開了賭場。諸多看客向這個體力與運氣都極好的男人報以掌聲,只有莊家像丟了魂似地一動不動,呆呆地看着男人遠去的背影。這個男人就是「寬客教父」—— 20 世紀中期的頂尖投資者愛德華·索普。從他開始,一場給後代寬客們留下深遠影響的算法戰爭拉開了序幕。 編程
索普於 1932 年出生在一個貧窮的複員軍人之家。他的父親雖在銀行從事保安工做,但在當時持續的經濟大蕭條影響下,家境非常慘淡。在這種環境中長大的索普早早地就接觸到了金融方面的知識,並養成了節儉的習慣。他很小的時候就學會了如何賺錢:花 5 美分買來果汁粉並沖泡成 6 杯果汁,每杯按 1 美分的價格賣出去就能盈利。他這麼作時才只有 10 歲。因爲好勝心很強又喜歡玩遊戲,索普還經常和加油站的大叔、超市的收銀大媽打賭。還有一次,他和雜貨店老闆打賭看誰算帳更快,他心算,雜貨店老闆用計算器算。結果索普取勝,贏得了一個冰淇淋蛋卷。 安全
索普對那些可以解釋各類平常現象的物理學和化學知識特別感興趣。他曾在車庫裏用收集來的化學材料作過爆炸試驗,還曾經把各類電子設備鏈接起來製造祕密通訊裝置。他學習物理時,用學到的理論知識解釋生活中的各類現象並進行實驗,非常癡迷。高中時的一天,老師說:「在賭場裏是絕對不可能贏到錢的,大家千萬不能染上賭博的壞習慣。」一貫爭強好勝的索普心想,賭場的遊戲也不過就是遊戲而已,確定有贏錢的辦法。他認爲,好比對於「輪盤賭」,能夠計算小球的運動從而得出小球落下機率最大的數字,在相應數字上下注便可取勝。可是,當時他們家如此貧困,根本不可能用成本高昂的「輪盤賭」來作實驗。最終,索普只得把對賭場的熱情拋諸腦後。後來,他在物理學競賽中得到一等獎,拿到了加利福尼亞大學洛杉磯分校的全額獎學金並進入該校學習。 編程語言
進入大學後的索普也沒有放棄「輪盤賭」實驗的想法。他只有獎學金而沒有其餘收入,生活並不寬裕,因而開始考慮尋找各類能夠掙錢的副業。對於爭強好勝的索普來講,賭博無疑是最好的選擇。他經常和同窗們探討是否能夠在博cai、競馬、撲克、圍棋等世界各大賭博遊戲中挑選一種勝率較大的來賭。同窗們大多認爲「輪盤賭」是最難贏的遊戲,由於輪盤中既有數字 1~36,還有 0、00 這種既不是單數也不是雙數,既不屬於黑色區域也不屬於紅色區域的特殊數字。所以,下單數的注時,最後小球落在單數區域的機率不是50%,而是 49%;下雙數的注時,最後小球落在雙數區域的機率也不是 50%,而是 49%。同理,下黑色區域的注時,最後小球落在該區域的機率依然不是50%,而是 49%。也就是說,因爲始終缺乏 1%,久而久之,玩家必輸無疑。固然,若是輪盤製做上存在缺陷,使得小球更容易落在某一數字的話,玩家也能夠利用這一缺陷提升勝率。可是,拉斯維加斯賭場內的輪盤製做極其精巧,落在任何一個數字上的機率都是隨機的,幾乎不可能預測小球會落到哪一個數字。 工具
不過,索普可並不這麼想。物理學家不就是計算輪盤之類圓周運動的專家嗎?想要計算小球在製做精良的輪盤上的運動軌跡,只需知道它的初始位置和運動速度,利用高中物理知識就能夠計算出來。在「輪盤賭」中,莊家轉動小球以後的一段時間裏,玩家依然能夠持續下注。所以,只要知道小球的初始位置和運動速度,就能夠計算出玩家應該下注的位置。索普立刻就將想法付諸實驗。他花 300 美圓買了一臺廉價輪盤,又借了臺高速相機,拍下了小球轉動的瞬間。測得小球的初始位置與運動速度後,得出了其下落位置的機率分佈圖。實驗彷佛進行得很順利,他對小球的初始位置和運動速度、輪盤摩擦係數等建模,用公式表示它們之間的關係。身爲物理專業的學生,將某一現象用公式表示出來,對他來講是一件再尋常不過的事情了。可是,最終有兩個問題擊敗了他。第一,廉價輪盤作工過於粗糙,精度過低,致使實驗結果很不穩定。輪盤的某些部分很粗糙、摩擦力大,某些部分又很光滑;輪盤表面不平整,小球偶爾還會蹦出來。但是購買一臺賭場裏用的精巧輪盤須要大約 1000 美圓,這是索普兩個多月的生活費,他買不起。第二,要想在賭場直接計算小球的初始位置、運動速度、下落的位置,須要一臺小型計算機和識別裝置,可是這樣的裝備又貴又不實用。索普只能無奈放棄了對「輪盤賭」的研究,決心攻讀博士課程。 學習
一心想着儘早畢業賺錢的索普選擇了必修課相對較少的數學專業。在攻讀博士學位期間,他對勝負和機率的熱情絲毫沒有減小。1958 年,索普即將博士畢業之際,獲得了去美國麻省理工學院擔任 CLE 摩爾講座教授的機會,這對應屆博士生來講但是一個至高無上的榮耀。博弈論創始人、電影《美麗心靈》男主角的原型——約翰·納什也曾是摩爾講座教授。在索普博士畢業那一年,他偶然獲得了一本期刊。這是美國統計學會會刊,上面刊載了美國陸軍總部數學家羅傑·鮑德溫的論文《「21 點」的最佳策略》,即如何運用統計分析的方法在「21 點」遊戲中獲勝。這引發了索普的極大興趣。與結果隨機的「輪盤賭」不一樣,在「21 點」中,玩家能夠採起多種策略提升勝率。 測試
「21 點」的遊戲規則很簡單:玩家想要幾張牌就抽幾張牌,最後牌面數字總和更接近 21 的一方獲勝,但總和超過 21 則爲輸。總和計算規則爲:牌面是數字的按對應的數字相加,J、Q、K 視爲數字 10,A 能夠視爲數字 1 或11。雖然還有一些附加規則,但該遊戲的基本規則就是這些。玩家手中的牌面數字之和若是不到 21,能夠繼續要牌;莊家的牌面數字之和若是不到 16,則必須繼續要牌;莊家牌面數字之和若達到 17 點以上,則不能繼續要牌。玩家經過比較本身與莊家已持的牌來決定是否繼續要牌,輸了需上交賭注,贏了則能夠得到雙倍賭注。 人工智能
人們以前一直認爲,即便玩家把握得當,「21 點」遊戲的勝率也僅爲 45% 左右。因爲勝率小於 50%,因此這個遊戲對玩家不利,久賭必輸,甚至會傾家蕩產。雖然關於「21 點」的遊戲策略多種多樣,可是撲克牌能夠構成無數排列組合,幾千萬種狀況的存在對於人腦來講根本就是天文數字。然而隨着計算機的出現,完成機率運算成爲可能。美國陸軍的數學家們耗時 18 個月,運用計算機計算了「21 點」遊戲中可能出現的各類狀況的機率,並撰寫了論文。好比說,如今個人牌面之和爲 16,莊家的牌面之和爲 9,若是我繼續要牌,則贏的機率爲 52.1%;若是中止要牌,則贏的機率爲 46.1%。也就是說,繼續要牌時贏的機率更大。根據該論文的研究結果,這一遊戲的最終獲勝機率爲 49.4%,是全部賭場遊戲中獲勝機率最接近 50% 的。儘管還不到 50%,看起來依然對玩家不利,但若是玩家運氣好,這實際上是最容易贏錢的遊戲。 spa
索普讀完這篇論文後激動得不能自已。他想,若是這些策略是可行的,那麼只需再深刻研究,應該就能得出勝率超過 50% 的算法。他想在去美國麻省理工學院任職以前,先對鮑德溫的論文進行實驗,因而隨即整理好行囊奔往拉斯維加斯賭場。索普把鮑德溫的論文內容整理成表格貼在手上帶進賭場,由於賭場裏不少人都會在手心貼上神的啓示或者護身符之類的東西,因此莊家對此並不在乎。最終,索普在連續奮戰了 9 小時以後,只輸掉了 100美圓賭注中的 8 美圓。他用親身經歷證明了鮑德溫論文所述策略的有效性。 設計
在親自實踐鮑德溫論文策略的同時,索普也發現了問題。鮑德溫的策略是以「每次都發 52 張牌」的條件計算機率的,然而在實際的賭局中,因爲莊家不會每一輪結束後就當即洗牌,因此隨着已發出的牌和剩餘牌的變化,機率也會發生變化。好比,這一輪已經發出了 3 個 A,那麼下一輪發出 A 的機率就會急劇減小;若是這一輪發出了 4 個 A,那麼接下來發出 A 的機率則爲 0%。也就是說,你能夠經過觀察已發出的牌來判斷對本身有利的狀況並下注。這就是電影《決勝 21 點》中著名的「高低算牌法」。
索普入職麻省理工學院以後,仍然堅持不解地研究「21 點」遊戲。他使用麻省理工學院計量中心內的 IBM-704 計算機與 Fortran 編程語言進行計算,並致函鮑德溫,詢問可否獲得後者的計算數據原稿。不久以後,鮑德溫就把寫滿本身和同事們的運算結果的草稿寄給了索普,這些草稿足足裝滿了一個紙箱。有了這些原稿的幫助,索普正式開始計算「21 點」遊戲中各情形的勝率。可是,僅以 52 張牌爲前提的狀況下就已經有數百萬種排列組合,再考慮已經出了幾張牌的全部狀況的話,排列組合將達到數十億種,根本沒法一一計算其機率。經過仔細觀察各類情形下的機率規律,索普得出了這樣的結論:數字爲 5 的牌是決定遊戲勝負的關鍵。5 越多,對莊家越有利,反之則對玩家越有利。就此,索普研究出了打敗賭場的策略,設計出本身的算法。
索普的第一個算法「數 5」(5-Counting)很是簡單。看桌上剩餘未發的紙牌中紙牌 5 的數量,若是佔比大於 1/13,就下小額賭注;若是小於 1/13,就下大額賭注。若是 5 都已經發完,則玩家的獲勝機率高達 53.6%,能夠下大賭注。
索普的特別之處就在於,他並不僅是經過判斷該遊戲對玩家有利或不利來下注,而是將每一種狀況的勝率都精確地計算出來,確認玩家的勝率能達到何種程度,而後才下注。紙牌 5 的數量佔比小於 1/13 時,5 越少對玩家越有利,下注金額就能夠越大。他還開發出了在不一樣狀況下仍然能夠迅速計算勝率的方法。事實上,在這以前,人們有過許許多多關於「21 點」遊戲算法的理論,可是在瞬息萬變並且禁止使用機器計算的賭場中,那些理論最終都難以獲得實際運用。所以,索普這種能夠簡便計算勝率的方法無疑具備劃時代意義。
利用索普的算法,人們能夠迅速計算勝率,根據桌上剩餘牌的狀況,在某些賭局中,玩家甚至能夠比莊家的勝率多出 20%。利用他的算法,玩家在賭局中對莊家能夠平均擁有約 1.2% 的優點,即勝率爲 51.2%。索普很想馬上將這一理論付諸實踐,可他面臨着幾個難題。首先,索普的經濟狀況並很差,家庭條件困難,實驗室的薪水也不高。即使能籌集到資金,也會因爲算法當時還不夠完善,沒法找出精確的下注方法。假設如今遊戲的勝率爲 55%,你手裏有 100 美圓,那麼能由於遊戲勝率大就把全部的錢都一次性押進去嗎?這其中仍然有 45% 的敗率,一旦輸了就血本無歸。那麼,將錢平分爲10 美圓,分 10 次下注呢?若是 10 次都輸,結果仍是一無所得;就算能贏 9次,因爲每次的下注金額都是 10 美圓,賭資沒有任何變化,也會致使錯過能贏更多錢的機會。這種方法的效率十分低下。若是精準地按照勝率下注,最後雖不會破產,可是須要堅持玩好久才行。爲了解決這樣的資金難題和下注問題,索普決心去拜訪麻省理工學院數學系的大師——克勞德·香農 教授。
索普在去拜訪香農教授以前的一個月,開始天天對着鏡子練習如何簡潔陳述本身的想法。曾任職于貝爾實驗室的香農教授是一個天才人物,他提出的兩種理論被譽爲「20 世紀最偉大的進步」:一是提出了「位」「字節」等信息的基礎單位,爲計算機的問世作出了巨大貢獻;二是提出了信息論,將數字概念用數學方式整理出來,讓通訊變爲可能。香農的信息論對咱們使用的互聯網、MP三、手機的發展以及對人類感知的研究等方面都產生了巨大的影響。香農仍是世界上首個製造國際象棋人工智能的人,儘管最終並無成功。索普拜訪香農教授一方面是想聽聽他的建議,另外一方面也是想請他幫助本身將論文發表在美國數學協會期刊上。香農教授當時是麻省理工學院惟一的美國數學協會會員,而向該協會投稿必須有會員的推薦。香農教授的祕書告訴索普,教授太忙了,只能安排 15 分鐘的會面。有傳聞說,香農教授若是聽到本身不感興趣的話題,會立馬起身走人,一分鐘都待不住。所以,索普要練習將本身的「21 點」算法儘量簡潔明瞭地描述給教授聽。
然而,索普的擔心徹底是多餘的。香農教授對賭場策略表現出了極大的興趣。由於對各類遊戲和輸贏感興趣,教授本身當時正好也在研究這些問題。香農教授稱讚索普的「21 點」算法是一項偉大的成就,而且向他介紹了本身和同事共同開發的凱利公式——最大回報率與信息的準確性成正比。將這一公式運用到投資或者賭局,能夠計算出在勝算較大的遊戲中每一輪應投注的賭資金額。
在當時,鞅收斂定理是專業賭徒們最經常使用的理論。根據這一理論,在第一局投入 1,若是失敗了再投入 2,繼續失敗就投入 4,以後只要贏一次,就能夠拿回本金。越輸就越增長賭注,以此挽回損失。可是這種方法有個大問題——賭注金額有限制。由於大部分賭場都對賭注的最大金額有明確限制,因此總有一次賭注金額會達到那個極限,讓人最終傾家蕩產。冒着如此高的風險去挽回不多的一點本金,效率過低了。
如何才能高效下注,這是一個很是難的問題。在《不肯定條件下的理性決策》①這一論文中,做者以 61 名接受過數學教育的年輕人爲實驗對象,給他們每人 25 美圓,在投硬幣遊戲中下注。因爲硬幣正面朝上的機率爲 60%,理論上來講獲勝的機率爲 60%,因此預期回報爲無窮大,玩的次數越多,贏的錢就越多。實驗將我的能拿走的最大賭資金額設定爲本金的 10 倍,即 250美圓。使人驚訝的是,實驗對象中有 28% 的人玩到了破產,平均支出的賭資只有 91 美圓。雖然這是一個勝負比爲 60 比 40 的高勝率遊戲,可是若是不懂得如何高效下注,就會像實驗參與者那樣玩到血本無歸。
香農教授就是由於看到了這些問題,因而研究出了高效下注的方法,即只拿出現有資金中必定比例的資金下注。這種方法絕對不會讓人破產,它會讓你在贏錢的時候加大賭注從而增長回報,在輸錢的時候減小賭注從而下降風險。若是上述實驗對象運用了凱利公式,在每一輪中只投入現有資金的 20% 做爲賭注,那麼大概在 13 輪遊戲以後就能夠拿到最大賭資金額 250 美圓。
① Haghani, 「Victor and Richard Deway」, Rational Decision-Making under Uncertainty,2016.複製代碼
根據香農教授的凱利公式,在遊戲中勝率越大、賠率越高,應投入的賭注比例也越高,這樣才能實現收益最大化。
下注比例 = (賠率×勝率 - 敗率) / 賠率複製代碼
例如,勝率爲 60%,贏了賭注變爲 2 倍,輸了上交賭注,那麼下注比例 = (1×60% - 40%) / 1 = 20%。
也就是說,只要投入現有資金的 20% 做爲賭注便可。當勝率小於 50% 時,遊戲對玩家不利,還不如干脆不下注。在「21 點」遊戲中,因爲勝率不斷髮生變化,因此勝率大時增長賭注,勝率小時減小賭注,就能保持長久的勝利。凱利公式後來成爲資產管理與投資中計算比例的法則,被沃倫·巴菲特、比爾·格羅斯等著名投資者引用,受到了普遍歡迎。
凱利公式成爲完善索普算法的最後一步。即使咱們能夠在勝率上比莊家更佔優點,那也要經過下注來將這一優點轉化爲實際利益。索普與香農教授想將這一研究結果發表在美國數學協會期刊上,以得到投資而後親身驗證。在與香農教授約好共同準備「21 點」遊戲的論文後,索普從座位上站起來準備離開。這時,香農教授叫住了他:
「你還研究過賭場裏的其餘玩法嗎?」
猶豫片刻後,索普當心翼翼地說出了本身在大學時期進行過實驗最後卻以失敗了結的「輪盤賭」的故事。「預測賭場小球運動的機器?」這一想法讓香農眼前一亮。要知道,他但是個機器達人。香農教授叫來本身的祕書,讓其取消當天全部的會面。在與索普通宵暢聊後,香農教授決定與他組成研究小組。
◊ ◊ ◊
香農教授與索普在共同準備《21 點常勝策略》論文的同時,也在祕密研究「輪盤賭」。在香農教授的幫助下,索普得到了賭場中實際使用的價值 1500美圓的輪盤與象牙小球,他利用相機與煙盒大小的便攜式計算機計算了小球的運動。通過幾個月的實驗以後,他們得出了這樣的結論:將輪盤分爲 8 個大小相同的區域,輸入小球初始位置並獲得小球第一圈的轉動速度後,能夠計算出小球最終停留區域的機率爲 60%。反正幾乎不可能準確預測小球的停留位置,那麼僅憑如今的方式也能夠將本來爲 44.84% 的勝率提升到 60%。
在這一套預測程序完成到必定程度後,他倆開始籌備將其運用於實踐。首先將便攜式計算機藏於鞋底,用一根細線鏈接按鈕與耳機。在小球轉動時,用小按鈕輸入小球運動的起始區域,在小球轉動一圈後再次按動按鈕以計算小球的運動速度。以後,計算機分別用「哆唻咪發梭拉西哆」8 個音傳遞小球掉落在 8 個區域中的哪一個區域,實驗者用耳機收聽。起初,在小球轉動一圈時,因爲按按鈕的時機老是不對,結果老是錯誤。索普乾脆沒日沒夜地泡在香農教授的實驗室,練習了整整一週以後,才終於獲得與以前計算數據相近的實驗結果。
如今,該去賭場實際操做了。索普穿上厚厚的衣服,用膠將細線粘在身上。爲了避免被人察覺,索普還將線塗上了與膚色、髮色相近的顏色。他還買了雙鞋跟很高的皮鞋,這樣就算鞋裏藏着計算機,看起來也不會太奇怪。就這樣,1961 年 6 月的一天,索普夫婦與香農夫婦一同前往拉斯維加斯賭場。
比起「21 點」遊戲的實驗,索普此次要緊張得多。由於「輪盤賭」的預測系統須要使用機器,一旦做弊行爲被人發現,機器就是他們沒法抵賴的證據。因爲懼怕被監聽和搜身,他們沒有入住酒店,而是在附近的一家汽車旅館住了下來。香農率先進入賭場,尋找輪盤合適、莊家看起來不太容易起疑的賭桌,找到以後向隊友們使使眼色,而後幾人匯合。香農在紙上寫下數字,假裝成一個彷佛在作某種計算的玩家,藉此吸引你們的關注,索普則趁機用機器計算而後下注。
機器運轉很順利。索普聽到耳機傳出的聲音後,在相應區域的數字中均勻地下注。系統的表現比預想的效果要好,沒多久,他就贏到了 2000 美圓。輪盤上的數字不是連續的,而是許多數字間隔而成。舉例來講,在 1 號區域裏,4 的旁邊是 2一、21 旁邊是 17……也就是說,在旁人看來,索普下注是
沒有任何規律的,他只是隨便挑了數字下注而已。
若是說系統有什麼不足之處的話,那就是線老是斷開。爲了令人不易察覺,他們把線作得極細,以致於輕微的動做也會拉斷線。線一斷,他們 4 人就得回房間去修理,這樣一來,一天以內他們得進出房間十屢次。
雖然系統預測較準確,使他們贏到了錢,可是反覆斷開的線讓索普感到很煩躁。他開始用高於凱利公式計算結果的比例進行下注。屢次成功以後,已經將賭注擴大到 2 倍、3 倍的索普更加信心大增,因而他將賭注增長到了最大比例。然而這一系統畢竟只能讓人在賭局中提升勝率,作不到 100% 的準確預測。爲此,索普在連續失敗 3 局以後,將這一天的收入輸得所剩無幾。
俗話說得好:屋漏偏逢連夜雨。坐在索普旁邊的女玩家忽然大叫了一聲,機器的線又斷了,假裝成膚色的電線掛在索普的臉上風雨飄搖。一行人趕緊收拾好電線飛也似地逃離了賭場,所幸賭場彷佛並無察覺到他們的異常。
香農與索普決定暫且擱置對「輪盤賭」的研究,直到有更先進的通訊設備與技術問世。由於以現有的喬裝技術和機器,他們很難專一於賭局,並且一旦做弊行爲被賭場發現,他們定會死無葬身之地。值得一提的是,索普在此次拉斯維加斯賭場之旅中收穫良多。他明白了一個道理:不管賭局對你如何有利,若是不遵循凱利公式胡亂下注,傾家蕩產可能就是分分鐘的事情。也就是這一經驗幫助索普在往後成爲了頗具傳奇色彩的投資家。帶着遺憾也帶着釋懷,香農與索普就這樣回到了麻省理工學院。
索普的論文經過了美國數學協會的審查,得以順利發表。起初,人們大多抱着將信將疑的態度,因此論文並無引發多大的反響。可是,隨着其算法在現實狀況下的有效性漸漸被人們所知,加上美聯社的記者對他進行了採訪,索普一晚上爆紅。美國各地的專業賭徒紛紛致電數學系辦公室,詢問本身是否能夠獲得論文。整個麻省理工學院幾乎被諮詢索普算法的信件淹沒,快要沒法正常工做了。甚至還有人沒完沒了地直接往索普家打電話或語音留言,他的妻子不得不掐斷了電話線。索普宣佈,他將於 1961 年 1 月在華盛頓舉行的美國數學協會冬季會議上就本身的論文發表首次演講。本來甚是枯燥無趣的數理會議卻擠滿了前來旁聽的人,有記者、專家學者,甚至還有黑社會人士。演講一結束,人羣蜂擁而至,想要向索普開出各類條件。有人表示要斥巨資買下他的系統,有人表示想花錢請他去作我的培訓,拉斯維加斯的一家大型賭場甚至表示願意爲他永久提供免費食宿,以宣傳本身的生意。固然,他們之因此願意這樣,是由於和其餘專業賭徒同樣,認爲索普的理論只不過是一種幻想。索普雖然對各類各樣的誘惑都沒有表現出太大的興趣,可是他很想親身實驗本身的系統。何況「21 點」又是一個極其燒錢的賭博遊戲,對於當時年薪 7000 美圓的他來講,僅憑我的財力根本沒法進行。索普最終決定與一個商人合做。
這位名叫艾曼紐·曼尼·基米爾的中年商人來自紐約,其名下的「肯尼停車公司」即將上市,他仍是喪葬業的巨頭。基米爾憑藉優秀的商業才能和雄厚的資金實力,從美國新澤西州紐瓦克機場旁的一家小停車場發家,逐漸掌控了整個紐約的停車業,後來又收購了清潔行業、設備業的一些公司,甚至還收購了著名的 DC 漫畫和演藝人經紀公司。1969 年,他又收購了華納兄弟電影公司,將其與時代華納合並,成立了世界上最大的傳媒公司。
實際上,基米爾最先是靠賭博和賣酒掘到第一桶金的。聽說,紐瓦克機場旁的那家小停車場就是他用在骰子賭博中贏來的錢買的。而「肯尼停車公司」之因此可以得到成功,也得益於他參與的許多非法的賭場生意。基米爾甚至還在美國實施禁酒令時期與黑社會組織勾結,靠酒類運輸掙了大錢。根據 1965 年美國聯邦調查局的報告資料,基米爾與一些國際性的黑幫組織頭目曾親密到了「拜把子」的程度。他癡迷於各類賭博,對「21 點」的鑽研尤爲深。因爲對索普的論文感興趣,他驅車近 5 小時,專程從紐約過來拜訪索普。
基米爾答應給索普投資 10 萬美圓,條件是他要拿走 90% 的收益。而索普認爲,拿着超過本身年薪 15 倍數額的錢去賭博,容易失去理智,也太容易引發別人的注意,因而他只要了 1 萬美圓。固然,基米爾對索普並不是全然信任。他雖然對數學理論知之甚少,可是就「21 點」方面的經驗,他堅信本身毫不亞於任何人。所以,他提出讓索普親自在賭局中打敗本身,以證實其論文內容的有效性。
基米爾開始發牌,他的手法是那麼嫺熟。那天,兩人玩了整整一個通宵。次日、第三天,他們又玩了整整兩天。以後的每一個週末,索普都開車前往基米爾位於紐約的家中,與他玩「21 點」。就這樣大約過了一個月,基米爾總算開始相信索普的算法是有效並切實可行的。索普對本身充滿信心,他表示,失敗的惟一可能就是賭場「出老千」。基米爾笑着說:
「你不用擔憂,我可最擅長揭穿賭場的這種騙局了。」
◊ ◊ ◊
兩人一同前往雷諾。雷諾是美國內華達州一座小型的賭場城市,索普和基米爾決定首先在這裏進行測試。畢竟拉斯維加斯人多嘴雜,認識基米爾的人也不少。若是徹底遵循計算結果,那麼本來應只在勝率大於 50% 的狀況下才下注,可是若是一味觀察別人的賭局,本身只在必要的時候才下注,這樣就太容易引發別人的察覺了。因而索普決定每局都參加,而且只下最小比例的賭注。
索普慢慢地計算着牌數,等待對本身有利的時機。雖然他每局只下最小的賭注,可是那天的運氣彷佛特別很差,有利的時機一直沒有出現。索普一直在輸錢,直到輸了 100 美圓。他大爲惱火,要求莊家容許他同時進行兩個賭局,可是遭到了拒絕。莊家覺察到他在留心觀察牌數,彷佛在計算着什麼,因而開始迅速發起牌來。索普也不甘示弱,快速地計算着牌數。隨着計算出的勝率不斷變大,索普漸漸增長了賭注。最終達到對莊家 15% 優點的時候,索普將賭注加到了 20 美圓。一局結束,他不只贏回了全部本金,還小小地賺了一筆,心滿意足地離開了座位。
算法的有效性在實際賭局中獲得了驗證,這讓索普和基米爾都感到興奮。此次該輪到基米爾實驗索普的系統了。這家賭場的最小賭資高達 500 美圓。基米爾按照與索普練習過的那樣,先計算勝率,再根據計算結果決定下注金額,不利時就只下最小賭注。就這樣,基米爾在短短 30 分鐘後就贏了5000 美圓,1 小時後贏得了 1.3 萬美圓,使得賭場不得不換掉了莊家。
新的莊家是個表情冷漠的 40 多歲的女性,也是賭場培養的專業「老千」。 「老千」會在洗牌的時候偷看牌,若是對牌不滿意,會偷偷把這張牌的下面一張牌遞出去。基米爾雖在輸了幾局以後意識到莊家「出了老千」,但礙於面子,他並無結束賭局。基米爾認爲,憑藉索普的算法,即便莊家「出了老千」,他也能夠贏。直到又輸了 2 萬美圓,他才收手,從椅子上站了起來。怒火中燒的基米爾向賭場抗議莊家「出老千」,可是因爲沒有證據,而且有其餘玩家表示從莊家這裏贏了錢,他的抗議被無視了。索普和基米爾爲了挽回損失,再次前往前一天贏錢的賭場。賭場裏的人認出了他們倆。在贏了 650美圓且勝率提升的狀況下,他們增長了賭注。然而莊家忽然開始洗牌,因而全部計算全都做廢,他倆不得不離開了座位。
實戰有別於理論,實際操做中每每充滿了各類變數。賭場會時刻留意那些贏錢的玩家,他們會在必要時「出老千」或者忽然洗牌,用這些手段干預玩家的行爲。而索普和基米爾兩人又必須儘可能不引發別人的關注,要僞裝成偶然贏了錢的樣子,在略有盈利以後就要收手轉往下一個賭場。
逐漸適應了實戰後的索普開始稱霸雷諾。他在市郊的小型賭場兩小時內贏了 1.7 萬美圓,以後在附近的賭場又贏了 6000 美圓。他經過給每張牌打分的簡單方式來計算牌數,而不是把全部的牌都記住。所以,不管莊家發牌有多快,索普均可以算出勝率。即便牌桌上有多名玩家,他也能夠把別人的牌數都計算出來,從而更加輕鬆地把握時機下注。
可是索普陷入了巨大的焦慮和被害妄想當中。他既要費心注意莊家什麼時候 「出老千」,又要擔憂被人識破而趕出賭場。隨着索普的長相和舉止漸漸被傳開,他開始被一些賭場拒絕進入。索普甚至還據說有些算牌的人被賭場私下抓走捱了毒打,因此在遊戲時更加當心謹慎。除此以外,基米爾還會隨時確認索普的賭局進展,甚至會對他進行搜身,以檢查他有沒有藏匿芯片。基米爾甚至經常無視索普的方案擅自下注,結果不只輸錢,並且還打草驚蛇。有一次,兩人在市區的一家賭場贏了 2.2 萬美圓,儘管索普反覆強調本身太累了沒法再計算牌數,基米爾仍是獨斷獨行要繼續賭,結果輸了 1.1 萬美圓。
從雷諾回來之後,索普確信本身的算法已經獲得了驗證,賭場的經歷也讓他有了不少感悟。他不再須要更多資金了。當初選擇與基米爾合做是爲了驗證算法的有效性,如今既然不須要錢了,兩人因而分道揚鑣。後來,索普前往美國新墨西哥州立大學任教,年薪漲了 50%。他還出了一本名爲《擊敗莊家》(1962)的著做,講述了「21 點」策略以及本身擊敗賭場的經歷。該書一經出版,馬上成爲賭徒們人手一本的「經典教材」,轟動一時。無數算牌人橫空出世,各家賭場甚至爲此召開緊急會議商討對策。儘管賭場給出了「要抓住算牌人並恐嚇」「要提升‘老千’的比例」等應對方案,可是從現實角度來講,要將算牌人一網打滿是根本不可能的。
雖然有不少人按照索普的書裏描述的那樣進行操做,但不多有人系統地實踐其理論。人們只關注牌數的計算,卻忽視了對下注比例起到關鍵做用的凱利公式。當人們經過算牌發現勝率對本身有利時,每每難掩衝動而增長賭注,最後反而輸了錢。這樣的狀況時有發生。
索普出版《擊敗莊家》以後,仍然不時前往拉斯維加斯的賭場。因爲實在太出名了,他只得經過換掉眼鏡、戴上假髮等假裝來隱藏本身的身份。儘管如此,人們仍是很快就能認出他來。一旦真實身份暴露,賭場便會將他驅逐出去,而且禁止他再次進入。1966 年,僅拉斯維加斯就去了 10 次的索普意識到本身已經太出名,不再能玩「21 點」了。聽說那一年夏天,他蓄起絡腮鬍前往賭場,可這一消息很快就在全部賭場之間傳遍了,以致於全部留着絡腮鬍的人都成了賭場的警惕對象。索普去了一家遠離拉斯維加斯的賭場,結果就連那裏也知道「絡腮鬍」的事情。
賭場在縝密研究以後,宣佈了一條能夠杜絕算牌人操做的新規定。他們引入了一種能夠一次性洗多套牌的機器,取名教授探測儀。如此一來,不只洗牌變得更爲輕鬆,人們也很難再計算牌數了,這大大下降了算牌人的勝率。固然,這裏的「教授」指的就是索普。
索普回憶起本身最後一次去賭場的情形。那天,他向身旁走過的服務員要了一杯咖啡,喝了一口以後,他突然感到意識和視野都變得模糊起來。咖啡裏被人下了麻醉劑。他搖搖晃晃地從桌前站起,回到房間睡了整整 8 小時才勉強清醒過來。若是把那杯咖啡都喝完的話,還不知道會發生怎樣的事情。意識到再繼續前往賭場會搭上本身的性命,索普決定轉往更安全合法的「賭場」——華爾街股市。
就這樣,「寬客的鼻祖」誕生了。
① 如認股權證同樣,指從傳統的基礎金融工具(股票)交易過程當中衍生髮展的新金融產品。複製代碼