第三部分 NN-ANN 70年前的逆向推演算法
從這部分開始,調整一下視角主要學習神經網絡算法,將其與生物神經網絡進行橫向的比較,以窺探一二。 如今基於NN的AI應用幾乎是滿地都是,效果也不錯,這種貌似神奇的玩意怎麼想出來的。我的不由好奇,隨後一通亂找。想理出來個線頭,誰知一挖發現這線後面的故事太豐富,這裏特地分享出來。編程
其實對神經元的認知是比較早的,在機制和功能方面可能是偏向生物學解釋,在這個領域最前面的天然是神經學和生物學家。在生物學框架下成果在二戰先後推動速度飛快(二戰期間德國和英美科研投入特別大,這也算是戰爭福利),逐步搞清楚一系列關於腦神經微觀上事實。直到1943年,神經學家McCulloch和邏輯學家(其實文章發表的時候他連高中文憑都沒有)Walter Pitts一篇共同的論文出現,一把將一堆其餘門類的學者拉進了大腦研究的大坑中。網絡
這篇叫作「A Logical Calculus of Ideas Immanent in Nervous Activity」的文章(第一次學神經網絡算法的同窗必看),其中提出來一個假說:在細胞在經過網絡鏈接能夠實現計算的能力,也就是是說」大腦是臺計算器「。說明了在細胞的基礎上能夠構建一套圖靈機,而這個工做模式可能就是大腦工做的本質。更進一步的是pitts給神經元設計了幾種基本鏈接模式,構成了完備的邏輯集合(相似於羅素搞出來的 與 或 非)進一步解釋一種大腦可能存在的運做機制。也就是說他找到了一組經過神經元簡單邏輯單元構建複雜計算的框架。在這套框架下生物學的機能解釋被邏輯框架組裝了起來。以後幾十年內,最主要的神經網絡算法都是在此基礎上調整改進.乃至到圍棋大師AlphaGo仍是得認它爲親媽。隨後Pitts被MIT和Norbert Wienner看中,招爲研究生。 沒錯,這個Wienner就是那個折磨萬千自動化系學生的[控制論]做者(此書很值得讀,輕薄小巧),Cybernetic學科的創始人。說到Cybernetic,這個被咱們叫作"控制論的"學習小組事實上在不僅是幹自動控制這一個事情,事實上這是一個雜學小組,目標是用數學邏輯的方法解釋全部能動的東西的機制,特別是活的。按照Wienner他老人家的說法,這個學科的目的就一個:統一通訊,控制,統計力學的核心問題。(Cybernetic自己是拉丁文翻譯出來的,原來的意思是"掌舵",聽聽看人家這氣魄.)重要的是這是一幫子實踐派,他們不知足於單純的學術研究,還總試圖把這些活的東西用別的方法造出來。因此這裏面的人就顯得特別神奇,一個學科裏面充滿了,數學家,生物學家,社會學家,物理學家,甚至還有心理學家以及各類工程師,惟獨沒有一個叫作控制學家。就這樣的一個雜學學科,在今天咱們的高校以單一技能專業化的方式授課,自動化系廣泛成了電子系第二專業,實在爲教學方式捏一把汗,Wienner若泉下有知不知會不會吐血再死一次。Pitts天然在wienner的帶領下參加Cybernetic組織。按照wienner在書裏面的說法,pitts認識了Claude Shannon,這時候的Shannon還沒開始搞信息論,主要工做是跟着Vannevar Bush(這貨搞的曼哈頓計劃)寫論文等畢業,當時他的畢業研究是搞開關電路(其實就是數字電路)。當時Wienner的把他兩搓到一塊兒就是想讓pitts去找到把「腦牌計算機」用數字電路造出來,讓Shannon給他傳播數字電路的知識。隨後又將pittes拉去參加小聚會,期間接觸到John von Neumann(這個現代計算機的發明人也是這個組織成員),這期間pitts主要給von Neumann和Goldstone的團隊說明「腦牌計算機」的故事,同時還作神經學的科普。這跨組織,跨學科的效果就是好,von Neumann把"Pitts's loops "用到了EDVAC的改進中(就是那篇文章的成果之一,這個loops具體說來就是經過閉環網絡實現內存),這下計算機的指令和數據基本存儲體系纔算是基本補全了。讀完這通才恍然明白,計算機和腦結構在不少方面的類似性原來不是偶然的,這幫人是在一塊兒混的。Cybernetic和計算機的產生其實還對研究現實問題在基本方法上產生根本性的影響,這個找時間咱們再說。框架
按控制論導論裏面的說法,McCulloch 和Pitts1947年還設計了一套盲人閱讀機,這套機器能模仿視覺皮層第四層的,惋惜年代久遠不能得見,甚至論文都找不到了。後來Pitts加入了一個小組,試圖用統計學,信息論,數學,生物學來搞清楚神經網絡的工做機制。當時他以爲神經元結構的學習造成過程能夠用統計力學來作過程建模。 1959年他們弄出來一篇關於青蛙視覺論文,裏面揭示了視覺到大腦的信息傳遞過程和內容和眼球自己對視覺信息的預處理機制。這對神經元網絡的數據輸入信息內容有了來自生物實驗的準確觀測,今天看來成效卓著。隨着着他對生物細節的瞭解,pitts對這條路漸漸感到絕望和Wienner的關係也產生了激烈的矛盾,一怒之下把博士論文給燒了。在後續能查閱到的研究中pitts對網絡結構自己的過程建模沒能作出更大的突破。沒多少年這位仁兄就掛了,實乃一大遺憾。Pitts這條故事線基本也就到這裏。以後在NN的研究就再沒有按照使用數學邏輯+生物學逆向工程的基本邏輯走下去的,逐漸與生物學分家了。神經學的研究又回到微觀細節上。 工具
而此後的NN真的就成了ANN(人工神經網絡),更可能是在算法和邏輯上直接發展了 ,這也就不難理解今天的神經網絡算法壓根不須要學習生物學了。oop
先丟開故事的精彩和神奇,仔細看看這個Pitts留下的遺產是什麼?學習
1:給出了神經元建模 ,也是NN沿用下來的McCulloch-Pitts Neurons 就是常說的MP/MCP 神經元。翻譯
2:找到了完備的基本的計算邏輯鏈接集合。圖中的每一個具體鏈接形式。設計
3:說明了如何用這些算子在開環結構中如何用這些基本的邏輯結構組建計算的功能。便是生物邏輯的圖靈機 blog
4:數學上解釋了若是在網絡中環裝鏈接會產生的遞歸效應(環狀網絡計算自身的效應)。
5:揭示了時間在環裝結構中的不存在。聽起來很詭異,一旦進入環裝邏輯之後就只有順序但時間被消除掉了,這個觀點在後來的不少學說上都被認可,但直觀上不容易理解。
這對40年代簡直是個奇蹟,這些信息能夠說是一套邏輯上的「現代計算機」模型了(儘管沒造出來),你能夠經過設計輸入"公式"和"數據"它就能幫你完成計算過程。事實上這也是咱們平常的「編程",「錄入」的基本模式。但往前一步,這和人腦比較下來任在工做範式上存在本質的差別---從「錄入」的信息中生長出「公式」的能力。這種能力就是「學習」,具有「學習」能力的系統,只須要向它輸入數據,它自身就能造成與之匹配的計算模式。 一樣在40年代Donald Hebb 搞出來一套叫作Hebbian learning的假說,歌詞大意就是當兩個神經元反覆激活,鏈接的關係會獲得增強。這個Hebbian是個心理學家,裏面沒有作複雜的數學邏輯論證和建模,Hebbian learning在後續過程就一直被當作工具或方法被沿用,直到後來發現LTP這個假說才獲得驗證。這個先放下不表。
基本上40年代NN最大的遺產就是MP 神經元和Hebbian Learning的基本思路,一直用到今天。後面咱們將MP神經元應用的發展做爲一條主線,看看pitts的這個假說到底帶來如何巨大的變革。