《人工智能雜記》人工智能簡史

1人工智能基本概念

人工智能(Artificial Intelligence,AI)是指計算機像人同樣擁有智能能力,是一個融合計算機科學、統計學、腦神經學和社會科學的前沿綜合學科,能夠代替人類實現識別、認知,分析和決策等多種功能。如當你說一句話時,機器可以識別成文字,並理解你話的意思,進行分析和對話等。web

這裏寫圖片描述

2人工智能發展歷程

**人工智能的起源:**人工智能在五六十年代時正式提出,1950年,一位名叫馬文·明斯基(後被人稱爲「人工智能之父」)的大四學生與他的同窗鄧恩·埃德蒙一塊兒,建造了世界上第一臺神經網絡計算機。這也被看作是人工智能的一個起點。巧合的是,一樣是在1950年,被稱爲「計算機之父」的阿蘭·圖靈提出了一個舉世矚目的想法——圖靈測試。按照圖靈的設想:若是一臺機器可以與人類開展對話而不能被辨別出機器身份,那麼這臺機器就具備智能。而就在這一年,圖靈還大膽預言了真正具有智能機器的可行性。1956年,在由達特茅斯學院舉辦的一次會議上,計算機專家約翰·麥卡錫提出了「人工智能」一詞。後來,這被人們看作是人工智能正式誕生的標誌。就在此次會議後不久,麥卡錫從達特茅斯搬到了MIT。同年,明斯基也搬到了這裏,以後兩人共同建立了世界上第一座人工智能實驗室——MIT AI LAB實驗室。值得追的是,茅斯會議正式確立了AI這一術語,而且開始從學術角度對AI展開了嚴肅而精專的研究。在那以後不久,最先的一批人工智能學者和技術開始涌現。達特茅斯會議被普遍認爲是人工智能誕生的標誌,今後人工智能走上了快速發展的道路。算法

人工智能的第一次高峯 在1956年的此次會議以後,人工智能迎來了屬於它的第一段Happy Time。在這段長達十餘年的時間裏,計算機被普遍應用於數學和天然語言領域,用來解決代數、幾何和英語問題。這讓不少研究學者看到了機器向人工智能發展的信心。甚至在當時,有不少學者認爲:「二十年內,機器將能完成人能作到的一切。」數據庫

人工智能第一次低谷: 70年代,人工智能進入了一段痛苦而艱難歲月。因爲科研人員在人工智能的研究中對項目難度預估不足,不只致使與美國國防高級研究計劃署的合做計劃失敗,還讓你們對人工智能的前景蒙上了一層陰影。與此同時,社會輿論的壓力也開始慢慢壓向人工智能這邊,致使不少研究經費被轉移到了其餘項目上。
在當時,人工智能面臨的技術瓶頸主要是三個方面,第一,計算機性能不足,致使早期不少程序沒法在人工智能領域獲得應用;第二,問題的複雜性,早期人工智能程序主要是解決特定的問題,由於特定的問題對象少,複雜性低,可一旦問題上升維度,程序立馬就不堪重負了;第三,數據量嚴重缺失,在當時不可能找到足夠大的數據庫來支撐程序進行深度學習,這很容易致使機器沒法讀取足夠量的數據進行智能化。
所以,人工智能項目停滯不前,但卻讓一些人有隙可乘,1973年Lighthill針對英國AI研究情況的報告。批評了AI在實現「宏偉目標」上的失敗。由此,人工智能遭遇了長達6年的科研深淵。網絡

人工智能的崛起 1980年,卡內基梅隆大學爲數字設備公司設計了一套名爲XCON的「專家系統」。這是一種,採用人工智能程序的系統,能夠簡單的理解爲「知識庫+推理機」的組合,XCON是一套具備完整專業知識和經驗的計算機智能系統。這套系統在1986年以前能爲公司每一年節省下來超過四千美圓經費。有了這種商業模式後,衍生出了像Symbolics、Lisp Machines等和IntelliCorp、Aion等這樣的硬件,軟件公司。在這個時期,僅專家系統產業的價值就高達5億美圓。app

人工智能第二次低谷:可憐的是,命運的車輪再一次碾過人工智能,讓其回到原點。僅僅在維持了7年以後,這個曾經轟動一時的人工智能系統就宣告結束歷史進程。到1987年時,蘋果和IBM公司生產的臺式機性能都超過了Symbolics等廠商生產的通用計算機。今後,專家系統風光再也不。機器學習

人工智能再次崛起: 上世紀九十年代中期開始,隨着AI技術尤爲是神經網絡技術的逐步發展,以及人們對AI開始抱有客觀理性的認知,人工智能技術開始進入平穩發展時期。1997年5月11日,IBM的計算機系統「深藍」打敗了國際象棋世界冠軍卡斯帕羅夫,又一次在公衆領域引起了現象級的AI話題討論。這是人工智能發展的一個重要里程。svg

2006年,Hinton在神經網絡的深度學習領域取得突破,人類又一次看到機器趕超人類的但願,也是標誌性的技術進步。性能

【注】Geoffrey Hinton的論文《A fast learning algorithm for deep belief nets》連接地址
在最近三年引爆了一場商業革命。谷歌、微軟、百度等互聯網巨頭,還有衆多的初創科技公司,紛紛加入人工智能產品的戰場,掀起又一輪的智能化狂潮,並且隨着技術的日趨成熟和大衆的普遍接受,這一次狂潮也許會架起一座現代文明與將來文明的橋樑。學習

這裏寫圖片描述

2016 年,Google 的 AlphaGo 贏了韓國棋手李世石,再度引起 AI 熱潮。測試

這裏寫圖片描述

AI不斷爆發熱潮,是與基礎設施的進步和科技的更新分不開的,從 70 年代 personal 計算機的興起到 2010 年 GPU、異構計算等硬件設施的發展,都爲人工智能復興奠基了基礎。

這裏寫圖片描述

同時,互聯網及移動互聯網的發展也帶來了一系列數據能力,令人工智能能力得以提升。並且,運算能力也從傳統的以 CPU 爲主導到以 GPU 爲主導,這對 AI 有很大變革。算法技術的更新助力於人工智能的興起,最先期的算法通常是傳統的統計算法,如 80 年代的神經網絡,90 年代的淺層,2000 年左右的 SBM、Boosting、convex 的 methods 等等。隨着數據量增大,計算能力變強,深度學習的影響也愈來愈大。2011 年以後,深度學習的興起,帶動了現今人工智能發展的高潮。

小貼士:人工智能開創先驅

第一位名人你們耳熟能詳,那就是大名鼎鼎的「計算機科學之父」和「人工智能之父」——阿蘭·圖靈(Alan Mathison Turing)。他對人工智能的貢獻集中體現於兩篇論文:一篇是1936年發表的《論數字計算在決斷難題中的應用》,在文中他對「可計算性」下了一個嚴格的數學定義,並提出著名的「圖靈機」設想,從數理邏輯上爲計算機開創了理論先河;而另外一篇論文對人工智能的影響更爲直接,其名字就是《機器能思考嗎》,在這篇論文中,圖靈提出了一種斷定機器是否具備智能的實驗方法,即著名的圖靈測試:若是一臺機器可以與人類展開對話而不能被辨別出其機器身份,那麼這臺機器就是智能的。「中文房間實驗」正是圖靈測試的一個變種。能夠說,圖靈是第一個嚴肅地探討人工智能標準的人物,被稱做「人工智能之父」當之無愧。

第二位名人是一位神童,18歲即取得數理邏輯博士學位,這就是「控制論之父」維納(Norbert Wiener)。1940年,維納開始考慮計算機如何能像大腦同樣工做,發現了兩者的類似性。維納認爲計算機是一個進行信息處理和信息轉換的系統,只要這個系統能獲得數據,就應該能作幾乎任何事情。他從控制論出發,特別強調反饋的做用,認爲全部的智能活動都是反饋機制的結果,而反饋機制是能夠用機器模擬的。維納的理論抓住了人工智能核心——反饋,所以能夠被視爲人工智能「行爲主義學派」的奠定人,其對人工神經網絡的研究也影響深遠。

第三位名人常常與圖靈搶「人工智能之父」的帽子,第一次提出了「人工智能(Artificial Intelligence)」這一名詞。他就是LISP語言發明者,真正的「人工智能之父」約翰·麥卡錫(John McCarthy)。在1955年,約翰·麥卡錫與另外一位人工智能先驅馬文·明斯基以及「信息論」創始人克勞德·香農一道做爲發起人,邀請各路誌同道合的專家學者在達特茅斯學院共同討論人工智能。會上,正是約翰•麥卡錫說服你們使用人工智能(Artificial Intelligence)這一術語,參會人員也熱烈討論了自動計算機、天然語言處理和神經網絡等經典人工智能命題。

3人工智能的研究領域及分層

人工智能研究的領域主要有五層,最底層是基礎設施建設,包含數據和計算能力兩部分,數據越大,人工智能的能力越強。往上一層爲算法,如卷積神經網絡、LSTM 序列學習、Q-Learning、深度學習等算法,都是機器學習的算法。第三層爲重要的技術方向和問題,如計算機視覺,語音工程,天然語言處理等。還有另外的一些相似決策系統,像 reinforcement learning(編輯注:加強學習),或像一些大數據分析的統計系統,這些都能在機器學習算法上產生。第四層爲具體的技術,如圖像識別、語音識別、機器翻譯等等。最頂端爲行業的解決方案,如人工智能在金融、醫療、互聯網、交通和遊戲等上的應用,這是咱們所關心它能帶來的價值。

這裏寫圖片描述

值得一提的是機器學習同深度學習之間仍是有所區別的,機器學習是指計算機的算法可以像人同樣,從數據中找到信息,從而學習一些規律。雖然深度學習是機器學習的一種,但深度學習是利用深度的神經網絡,將模型處理得更爲複雜,從而使模型對數據的理解更加深刻。

關於人工智能、機器學習和深度學習之間的關係請看筆者的另外一篇文章。

4人工智能的應用場景

 計算機視覺
2000年左右,人們開始用機器學習,用人工特徵來作比較好的計算機視覺系統。如車牌識別、安防、人臉等技術。而深度學習則逐漸運用機器代替人工來學習特徵,擴大了其應用場景,如無人車、電商等領域。

 語音技術
2010 年後,深度學習的普遍應用使語音識別的準確率大幅提高,像 Siri、Voice Search 和 Echo 等,能夠實現不一樣語言間的交流,從語音中說一段話,隨之將其翻譯爲另外一種文字;再如智能助手,你能夠對手機說一段話,它能幫助你完成一些任務。與圖像相比,天然語言更難、更復雜,不只須要認知,還須要理解。

 天然語言處理
目前一個比較重大的突破是機器翻譯,這大大提升了原來的機器翻譯水平,舉個例子,Google 的 Translation 系統,是人工智能的一個標杆性的事件。2010 年左右, IBM 的"Watson"系統在一檔綜藝節目上,和人類冠軍進行天然語言的問答並獲勝,表明了計算機能力的顯著提升。

 決策系統
決策系統的發展是隨着棋類問題的解決而不斷提高,從 80 年代西洋跳棋開始,到 90 年代的國際象棋對弈,機器的勝利都標誌了科技的進步,決策系統能夠在自動化、量化投資等系統上普遍應用。

 大數據應用
能夠經過你以前看到的文章,理解你所喜歡的內容而進行更精準的推薦;分析各個股票的行情,進行量化交易;分析全部的像客戶的一些喜愛而進行精準的營銷等。機器經過一系列的數據進行判別,找出最適合的一些策略而反饋給咱們。

5人工智能的挑戰

計算機視覺:將來的人工智能應更加註重效果的優化,增強計算機視覺在不一樣場景、問題上的應用。
語音識別:當前的語音識別雖然在特定的場景(安靜的環境)下,已經可以獲得和人類類似的水平。但在噪音情景下仍有挑戰,如原場識別、口語、方言等長尾內容。將來需加強計算能力、提升數據量和提高算法等來解決這個問題。

天然語言處理:機器的優點在於擁有更多的記憶能力,但卻欠缺語意理解能力,包括對口語不規範的用語識別和認知等。人說話時,是與物理事件學相聯繫的,好比一我的說電腦,人知道這個電腦意味着什麼,或者它是可以幹些什麼,而在天然語言裏,它僅僅將"電腦"做爲一個孤立的詞,不會去產生相似的聯想,天然語言的聯想只是經過在文本上和其餘所共現的一些詞的聯想, 並非物理事件裏的聯想。因此若是要真的解決天然語言的問題,未來須要去創建從文本到物理事件的一個映射,但目前仍沒有很好的解決方法。所以,這是將來着重考慮的一個研究方向。

決策系統:存在兩個問題,第一是不通用,即學習知識的不可遷移性,如用一個方法學了下圍棋,不能直接將該方法轉移到下象棋中,第二是大量模擬數據。因此它有兩個目標,一個是算法的提高,如何解決數據稀少或怎麼自動可以產生模擬數據的問題,另外一個是自適應能力,當數據產生變化的時候,它可以去適應變化,而不是能力有所降低。全部一系列這些問題,都是下一個五或十年咱們但願很快解決的。

這裏寫圖片描述