數學模型與計算機科學的認知

時間 2019-12-09

原文原文鏈接

長時間地呆在解決數學問題的世界裏，反而會讓你看不清楚數學的本質，或者數學的根本性的東西。這個觀點，陳省身（Shiing-Shen Chern）和陶哲軒（Terence Tao）都表達過。陳省身在談論納什（John Nash, 電影《美麗心靈》的主角，諾貝爾經濟學獎得主）的時候就反覆提到：John Nash固然是個出色的數學問題的解答者，一天到晚都在作題目。但是，他真的是不懂數學。而陶哲軒在回顧本身的早年經歷也這樣說：在作數學研究以前，整個對數學的工做就是不斷地去作題目，覺得解決一個又一個的難題，就是數學家一生乾的事情了。直到本身真正走上數學家的道路，才發現，那時候的本身根本不懂數學。算法

戲劇的隱喻

在數學當中解決問題，很像是作programming的人在解決算法問題同樣。這是領域中最難吭的骨頭之一，也同時是挑戰智商的舞臺，是享受心智的榮耀的最佳場所。但從更加宏觀的角度來看，這些事情雖然有必定的重要性，但作出的貢獻畢竟比較微觀，屬於：在別人搭建好的舞臺上演戲。你固然能夠專一於去解決特定舞臺上的重要問題，甚至去解決一些各個舞臺都通用的技術問題。但是，你可否從零開始搭建起一個舞臺，可否構建出一個精彩的故事，可否將精彩的故事從其它形式恰如其分地轉移到你熟悉的場景，纔是戲劇最關心的問題。數據庫

讓咱們來問一個幼稚但卻微妙的問題：爲何說這纔是戲劇最關心的問題？爲何燈光、造型、片子的剪切藝術，不是戲劇最關心的問題？設計模式

由於，戲劇的故事，舞臺所傳達的故事內涵，纔是人們真正關心的。你這個戲劇是否可以繼續在社會中存活下去，取決因而否有源源不斷的觀衆前來觀看，即：是否有社會中其它成員的關注。而故事以及故事的展示方式，纔是吸引這些觀衆的核心。戲劇的價值在於它可以提供一種媒介，充分地表達和探索那些生活表面之下潛藏的真相，用極端的戲劇衝突極集中現那些隱藏的祕密。因此，這些精心設計的故事和表現方式所提供的揭示生活真相的服務，是讓戲劇賴以生存的根本。而那些舞臺技術細節，是構建故事的技巧。它重要，但卻不是根本與核心。框架

總結起來，什麼東西纔是一個領域的核心價值呢？就是這個領域，可以爲世界提供的不可替代的東西。若是這個領域所提供的東西，再也不受到社會中其它成員的關注，它便會走向枯萎，便會死掉。工具

那麼一樣的，僅僅在數學中作題目，在計算機中作算法，對於各自的行業來講它重要，但卻不是核心。過度地陷入這些過程，會讓你一葉障目，陷入到這些微觀細節之中。不管數學仍是計算機，它的核心價值是提供一種供其餘領域使用的工具，或者一種幫助其它領域梳理細節的服務。學習

計算機科學的認知

對於計算機來說，它的本質在於運用機器來解放人類的生產力，也就是幫助一個個的人幹活兒，特別是那種單調乏味的機械性的活兒。那麼以此爲標準，對於其它領域的人來講，運用你的計算機技能，經過printf不斷地輸出具有固定格式的短信的價值，要大於你對複雜算法的研究。由於這裏的重點依舊在於，你是否把握住了你這個行業可以在世界中存在的核心：可否幫助人類幹活。至於華麗的專業名詞，諸如大數據、人工智能、深度學習、設計模式等等，其實都不是重點，或者說，它們彼此之間其實並無一個高貴與低賤之分。你不能說研究深度學習的人比研究古老的關係數據庫存儲的人來得高貴，或者寫for循環的人就比只寫printf的人高貴。單看這些說辭，會以爲很荒謬，由於它徹底沒有抓住重點。重點在於你寫出的代碼或者弄出來的產品，是否對你當前的服務對象有價值有幫助。它是否可以幫助你當前的服務對象，更好地解放生產力。大數據

若是繼續用以前例子來講，對於須要重複發送短信的人來講，寫出printf是核心，由於它解決了這個業務問題，不用再讓用戶作機械的發送動做。而一堆for，只是循環卻不輸出，並不會對業務起到半毛錢的效果。一樣的，若是你服務的對象，僅僅是一個工廠，那麼運用Excel的各類奇淫巧技，或許更能獲得上司的親耐。可你非要在工廠裏面，部署Google那樣的計算機集羣，那估計你離被開除也就不遠了。ui

這裏想要說的是，若是純粹從技術的角度看，不一樣技術之間實際上是不存在好壞高下之分的，由於它僅僅是一個個客觀的知識或者知識規律的總結。真正有高下好壞之分的，在於你的技術應用於業務的合理性、恰當性與優良性。可每每，身陷技術細節的人，會迷失或者自嗨在本身的領域，以本身的流行名號做爲高人一等的資本。可這些名號僅僅是「表」，是外在的「名」，它沒法撼動核心價值。重要的是，面對你要處理的業務和要服務的客戶，選擇什麼技術工具是合適的。使用什麼樣的技術組合才能更高效、更優雅地解決用戶的問題。人工智能

數學的認知

對於數學來說，這樣的認知和思惟方式是相同的。數學的做用在於提供一種嚴格的定量討論的框架。它的理論成果，用於從另外一個角度去梳理事物之間的數量和變化關係，讓整個問題的討論，變得更精確、更嚴密。而不是悶頭學習基礎知識，爲更加深奧的理論作鋪墊。等鋪墊結束，繼續去鑽研更深奧理論中的難題，或是爲構建更深奧的理論作準備。設計

毋庸置疑，把當前的材料，進行加工和組合，天然會變成更加深奧複雜的東西。但是，爲何要構建這些理論呢？爲何要作這樣的組合與粘連呢？沒人能夠限制你作任意的組合。可是，對其餘領域的貢獻和做爲工具性的好使程度，是衡量你的組合是否有意義的一個標準。

我想，更有意思的問題是，我爲何要作這樣的組合，爲何要去這樣搭建一個數學框架，爲何那樣不能夠？從這些問題的回答中，你會明白數學對生產力的貢獻，它最核心的基本價值在哪裏。

讓咱們用天然語言處理（NLP）的例子來作一些說明。

若是想要根據文本自己，來進行語義的推斷或者分類，一個重要的基礎即是提供評價關鍵詞的重要性的指標。這樣的指標在不一樣的模型下有不一樣的體現。其中一種方式，是運用詞袋（Bag of Words）模型，將一個文本向量化。運用一個重要的參考指標TF-IDF，來衡量這個關鍵詞的對目標文本的重要程度。其中：

TF是Term Frequency，用於衡量這個詞在目標文本中的出現頻率：
IDF是Inverse Document Frequency，表示這個詞在其它文本中出現的頻率。

那麼，一個粗略的TF-IDF指標即是：

這個詞在文本中的出現頻率這個詞在其它文本中出現的頻率

直接看這兩個定義會讓人一頭霧水，讓咱們從另外一個角度來考察一番。一個詞對於目標文本是否重要，一個質樸的想法是看它在這個文本當中出現的頻率是否夠高。你能夠粗略地認爲，它在這個文本中出現的頻率越高，這個詞就越可以表徵這個文本的含義，也就是越重要。那麼，TF就能夠以正相關的方式，體如今TF-IDF的指標中。

而若是這個詞是相似於the這樣的常見卻又沒什麼含義的詞彙，它就不能做爲目標文檔中的意義表徵。那麼怎麼衡量它是不是一個常見又沒有實質含義的詞彙呢？一種直觀即是用它在其他文本中出現的次數來作表徵。若是它越多的在其它文本中出現，那就越是說明這個詞對於目標文原本說是不重要的。因而能夠在TF-IDF中以倒數的形式呈現出來。這樣，就解釋了上面這個粗淺的公式。

但回到咱們以前的那個問題，爲何這裏必定是這樣的公式？其合理性在哪裏？換一個行不行？

例如，若是單詞A在文本中出現100次，單詞B出現200次，那是否是說單詞B的重要性就是A的2倍？爲它加一個對數來作平滑，是否是能夠？若是這個詞在其它文檔中出現的次數都爲0，那上面這個指標TF-IDF不就會出現分母爲零的狀況嗎？應該怎麼解決這個問題？爲它們預先增長一個1？仍是應該增長多少？

面對一個現實問題，或者當數學真正運用在其它領域時，其重點不在於哪一個公式是對的。由於，每個公式表徵的是每一種對現實的認知與偏見，它對應到一個數學模型。而全部模型，都必然是與你研究重點相關的一種近似和簡化。不存在正確的模型，只存在更好更優良的模型。數學所提供的，正是如同軟件通常的工具模塊。幫助你剖析問題，將你所關注的要點，以更加細密的方式展示出來。

不是說在模型中運用了微積分就比僅僅使用四則運算更高明。也不是說，你的模型中用到了現代數學或者集合論的抽象，就更加酷炫先進。這些都只是表，如同計算機的for循環和printf。重要的在於：運用了數學某個理論分支後，它所搭建的框架，是否將待解決的問題梳理得更清晰？在這樣的梳理之下，這些問題是否是獲得了更好的表述和說明？在這樣的表述下，我關心的問題是否是更容易被解決？

正如關於世界地圖拼圖的故事所展示的：直接拼湊世界地圖是困難的，但若是它的反面剛好是一我的像，世界地圖將會由於背面人像的成功拼湊而獲得更容易的實現。

那麼數學這個理論工具的做用即是如此。它爲其它領域提供一種獨特的定量分析視角，將問題的細緻末節挖掘得更深，考察得更仔細。一旦將一個東西被歸入到數學框架中作考慮，它就會像天然光被三棱鏡分解同樣，被數學框架作最精細的剖析。數學框架將每個邏輯點分門別類地擺放好，以便更加清晰地凸顯出事物內在邏輯的自洽性。這個工具自己不是用來評判或者增長原有材料的價值，而是做爲一個客觀的觀察工具（比如三棱鏡、比如望遠鏡），將事物內部複雜而隱祕的邏輯脈絡完整呈現。這是這個工具真正厲害的地方。

越是理論、抽象的東西，越不容易看出應用方式的困難和解決問題的困難之間的區別。前者是一個宏觀的方向性的東西，後者是一個深刻的執行性的東西。而境界差距，就體如今對前者的把控和後者的適當運用。

爲何這個地方要用除法，爲何這個地方要取對數？

對深陷理論的人來講，ta只會從一種角度去尋找答案：如何根據上下文，運用嚴密的邏輯，推導出一個答案。從何嘗試考慮：是否是由於我想要在這裏發揮一個平均的做用；想要給它一個相反的用力效果；又或是計算太複雜，不如取個對數讓它簡單些的外部理由。而只是鑽入到更深奧的理論中，看這個問題是否在其它理論中有個說法。

這其實體現了一種知識上的奴性。你只是不斷地在尋找paper、尋找已有理論，去佐證一個模型或公式。而歷來不會根據本身的實際需求，從你對業務的理解、對所要解決問題的認識，去評判模型的優劣，評價公式恰當與否。

數學的歷史早已向咱們說明，實踐是先於理論的。微積分先是在工業中獲得熟練運用，而後纔是在很長的時間後被數學家們完善，成爲一套牢固的理論。爲何數學的歷史、科學的歷史會這樣發生？由於數學的職能是爲了將一個問題剖析得更清晰而存在的，是以實際問題爲驅動爲導向。若是沒有要解決的問題，你空拿屠龍寶刀有何用？龍都沒有了，到哪裏去運用你的屠龍之術？若是你服務的對象須要的是對家畜的屠宰之術，你絢爛的屠龍之術又於事何補？

因此，不能僅僅是從數學的內部去考慮問題，要多從外部去作宏觀的思考：爲何我要作這個假設，爲何我要這麼去構建一個公式，換一種方式行不行。沒有這樣的素養，面對新的未被開坑的領域，沒有任何教科書和現成公式做借鑑，你只能茫然無措。

數學的理論成果，正是一個個的建築基石——building block。它們比如是設計師手中積累的素材。老是累計素材或者考量素材的製做方式是不夠的。最後的臨門一腳，須要將這些素材經過嘗試和實驗，巧妙地鏈接起來。

面對一個個數學building block，你能夠真正地把它們當作樂高積木。用它們去作各類拼湊與嘗試，看你組合出來的成果是否有利於你問題的解決和闡述。沒有人知道哪一種組合方式是恰當的。你須要作的是根據直覺、業務的理解，挑選出一些block，搭建好雛形，而後開始試驗。根據試驗所反饋的結果，來修正本身積木的搭建方式。如此往復，不斷地打磨本身建造的數學模型，從而構建出適於解決當下問題的順手工具。