不久以前我曾與一位大型銀行的首席執行官一同用餐。他正在考慮是否要退出意大利市場,由於經濟形勢不景氣,並且將來極可能出現一場歐元危機。 網絡
這位CEO手下的經濟學家描繪出一片慘淡的景象,而且計算出經濟低迷對公司意味着什麼。可是最終,他仍是在本身價值觀念的指引下作出了決定。 工具
這家銀行在乎大利已經有了幾十年的歷史。他不但願意大利人以爲他的銀行只能同甘不能共苦。他不但願銀行的員工認爲他們在時局艱難之際會棄甲而逃。他決定留在乎大利,無論將來有什麼危機都要堅持下去,即使付出短時間代價也在所不惜。 大數據
作決策之時他並無忘記那些數據,但最終他採用了另外一種不一樣的思惟方式。固然,他是正確的。商業創建在信任之上。信任是一種披着情感外衣的互惠
主義。在困境中作出正確決策的人和機構可以贏得自尊和他人的尊敬,這種感情上的東西是很是寶貴的,即使它不能爲數據所捕捉和反映。 spa
這個故事反映出了數據分析的長處和侷限。目前這一歷史時期最大的創新就在於,咱們的生活如今由收集數據的計算機調控着。在這個時代,頭腦沒法理解的複雜狀況,數據能夠幫咱們解讀其中的含義。數據能夠彌補咱們對直覺的過度自信,數據能夠減輕慾望對知覺的扭曲程度。 事件
但有,些事情是「大數據」不擅長的,下面我會一一道來: get
數據不懂社交。大腦在數學方面不好勁(不信請迅速心算一下437的平方根是多少),可是大腦懂得社會認知。人們擅長反射彼此的情緒狀態,擅長偵測出不合做的行爲,擅長用情緒爲事物賦予價值。 數據分析
計算機數據分析擅長的是測量社會交往的「量」而非「質」。網絡科學家能夠測量出你在76%的時間裏與6名同事的社交互動狀況,可是他們不可能捕
捉到你心底對於那些一年才見2次的兒時玩伴的感情,更沒必要說但丁對於僅有兩面之緣的貝阿特麗斯的感情了。所以,在社交關係的決策中,不要愚蠢到放棄頭腦中
那臺充滿魔力的機器,而去相信你辦工做上的那臺機器。 數學
數據不懂背景。人類的決策不是離散的事件,而是鑲嵌在時間序列和背景之中的。通過數百萬年的演化,人腦已經
變得善於處理這樣的現實。人們擅長講述交織了多重緣由和多重背景的故事。數據分析則不懂得如何敘事,也不懂得思惟的浮現過程。即使是一部普普統統的小說,
數據分析也沒法解釋其中的思路。 產品
數據會製造出更大的「乾草垛」。這一觀點是由納西姆??塔勒布(NassimTaleb,著名商業思想家,
著有《黑天鵝:如何應對不可知的將來》等書做)提出的。隨着咱們掌握的數據愈來愈多,能夠發現的統計上顯著的相關關係也就愈來愈多。這些相關關係中,有很
多都是沒有實際意義的,在真正解決問題時極可能將人引入歧途。這種欺騙性會隨着數據的增多而指數級地增加。在這個龐大的「乾草垛」裏,咱們要找的那根針被
越埋越深。大數據時代的特徵之一就是,「重大」發現的數量被數據擴張帶來的噪音所淹沒。 反射
大數據沒法解決大問題。若是你只想分析哪些郵件能夠帶來最多的競選資金贊助,你能夠作一個隨機控制實驗。但
假設目標是刺激衰退期的經濟形勢,你就不可能找到一個平行世界中的社會來當對照組。最佳的經濟刺激手段究竟是什麼?人們對此爭論不休,儘管數據像海浪通常
涌來,就我所知,這場辯論中還沒有有哪位主要「辯手」由於參考了數據分析而改變立場的。
數據偏心潮流,忽視傑做。當大量個體對某種文化產品迅速產生興趣時,數據分析能夠敏銳地偵測到這種趨勢。可是,一些重要的(也是有收益的)產品在一開始就被數據擯棄了,僅僅由於它們的特異之處不爲人所熟知。
數據掩蓋了價值觀念。我最近讀到一本有着精彩標題的學術專著——《‘原始數據’只是一種修辭》。書中的要點之一就是,數據歷來都不多是「原始」的,數據老是依照某人的傾向和價值觀念而被構建出來的。數據分析的結果看似客觀公正,但其實價值選擇貫穿了從構建到解讀的全過程。
這篇文章並非要批評大數據不是一種偉大的工具。只是,和任何一種工具同樣,大數據有拿手強項,也有不擅長的領域。正如耶魯大學的愛德華??圖弗特教授(EdwardTufte)所說:「這個世界的有趣之處,遠勝任何一門學科。