不認識總體就不可能認識局部,一樣,不認識局部也不可能認識總體。 - Blaise Pascal算法
這本書,不是一部算法簡史,而是一部計算科學簡史。或者如副標題所言,講的是」從數學到機器的故事」。做者從歷史的角度,把數學、邏輯學和計算機這三個學科,溯源追流,統一到計算這個核心命題上。工具
第一部分從數學和邏輯學兩大基礎學科的起源和演進開始,到萊布尼茨之夢的破碎結束。
自源頭以降,經過三次成功的抽象化運動,人類創造並完善了一個令愛因斯坦爲之驚歎的「人類創造的、獨立於全部經驗的數學」。大數據
第一次抽象運動, 咱們從各類各樣的具體事物中抽象出了「數」。網站
第二次抽象運動,咱們抽象出了「幾何」。搜索引擎
第三次抽象運動,咱們抽象出了「代數」。設計
而在古希臘,亞里士多德也成功地爲邏輯學抽象出了三段論,進而演化出三種大相徑庭的形式推理:3d
從通常到特殊 - 演繹法blog
從特殊到通常 - 概括法索引
從特殊到特殊 - 溯因法ci
自此,人類擁有了兩種推理方式:演繹法成爲基於理性的數學工具,概括法成爲基於經驗的科學研究工具。這兩種推理方式,也分別成爲了指導科學研究和工程實踐的兩大經典範式:理論範式和經驗範式。
而在當時被冷落的溯因法,在數據和信息氾濫的今天,也成了第四範式-數據驅動範式的基礎,被認知主義者改名爲「貝葉斯推斷」。
各自領域抽象運動的成功,以及對數學和邏輯學共同之處的認識,推進了調和數學與邏輯的高漲熱情。萊布尼茨說他有一個理想:全部科學的思想,能劃歸爲較少的、簡單的、不可分解的思想,利用它們能定義全部其餘思想。這是個多麼恢弘的理想啊!若是這個理想得以實現的話,那麼咱們就能夠經過分解和組合各類思想來達到分析和發現新思想的目的,一切如同數學中的演算過程當中同樣。
然而,歷史歷來不相信所謂的瓜熟蒂落。哥德爾在1931年,以不完備定理爲槌,擊碎了萊布尼茨之夢。他告訴人們:完備性和一致性二者不可兼得。如巴別塔同樣,人類把數學做爲可對一切科學思想進行理性推演的廣泛文字的理想也不可能實現。
後面的故事,更多關於數學世界與物理世界聯姻的故事(或者叫異類聯想(bissociation)), 聯姻的產物是計算機。而其中三次重要的聯姻成就了計算機科學史上的三大豐碑。
托馬斯-貝葉斯左手挽起溯因法,右手挽起互聯網。在大數據的洶涌大潮下,勇敢放棄了因果推斷,認真攻克「若是用戶上次買了鞋子,此次會買帽子的可能性」的問題,把相關性和行爲主義的功夫玩得爐火純青。今天,成爲幾乎全部互聯網系統的核心大腦。
香農用信息論讓二進制計算和電子電路成功牽手,成功把「bit」扶上信息論的王座,奠基了信息時代和數據時代長久繁榮的基礎。
維納用控制論串聯起計算與電子電路,教會人們在這個混沌的、不肯定的物理世界,放棄預測,快速響應纔是最好的預測,以及怎麼去作。
這些, 不只從新塑造了咱們所處的這個世界,也重塑了咱們的思惟。如今,信息論、控制論、系統論以及貝葉斯推理已經成爲咱們在信息時代和智能時代分析和解決問題的必備思惟模型。
當咱們把目光從過去,移到如今和未來時,咱們正面臨一個「大」世界。吳軍說過計算機思惟和傳統人類思惟最基礎的區別是「小大之辯」。咱們面臨的這個世界,數據量、信息量之大亙古未有,超越人類的進化速度,因此進化論不能幫咱們解決這個問題。因而,咱們藉助於貝葉斯推理、信息論和控制論,更進一步地,藉助於物化的計算機和算法來幫助咱們處理信息,咱們致力於可計算化。因此,最近十幾年來,咱們有「計算廣告」、「計算攝影」、「計算設計」……,這份愈來愈長的「計算xx」名單,背後是愈來愈多的責任讓渡。
但計算機和算法只能幫助咱們作出事實判斷,沒法作出價值判斷。計算機結合大數據產生的力量在不斷增加,幫助咱們作到了本來沒法作到的事。而硬幣的另外一面是,咱們不只沒法作到,也沒法理解計算機是如何作到的,由於沒法理解,因此也很難干預。咱們好像正在跟一個情商幼稚但能力驚人的舞伴共舞,咱們還沒準備好。
計算機和算法不會製造偏見,但它會傳播偏見,之前所未有的速度。當人類輸入帶有價值偏見的信息後,計算機會把它們看成事實!書中舉的一個例子:若是你在搜索引擎中輸入「科學教」三個字,大多數搜索引擎提供的網站信息都是對其有利的。這並非巧合,由於大多數互聯網用戶都是在研究本身感興趣的主題,因此他們先入爲主地對搜索話題抱有積極的想法。你看,計算機和算法誤把人們的偏見性輸入當成了事實,最終成爲了傳播偏見的幫兇。在事情自己是什麼和人們所相信的」事情是什麼「之間,計算機和算法擋了一塊屏幕-一塊切實的屏幕。
但咱們沒有退路,咱們惟有前行,惟有相信技術能解決技術帶來的問題,不忘人類走到此處的初心,並嘗試更多的抽象和異類聯想,努力解決問題。
莫慮前途遠,開航逐便風。