到底什麼成就了今天的人工智能?(上)

摘要: 人工智能發展迅速,但是到底什麼成就了今天的人工智能呢?跟隨咱們一塊兒來探索吧。

維基百科對智能有以下定義:算法

智能是一種可以感知或推斷信息,並將其做爲知識留存下來,自適應地用於某種環境或上下文的能力。數組

    • *

人工智能(Artificial Intelligence)
雖然咱們很難對人工智能作一個確切的解釋,但能夠從查爾斯巴貝奇的分析機講起。它雖然沒有任何特殊的「自適應」能力,但卻很是靈活。遺憾的是,理論上雖然完美,但卻沒有得以實現。網絡

巴貝奇分析機早圖靈機50年左右出現。從理論上講,它可以將任何可計算的函數做爲輸入,並在徹底機械的狀況下產生輸出。架構

複雜性理論(complexity theory)由此得以發展,同時人們也意識到構建通用計算機其實相對簡單。此外,算法的實現也愈加多樣。儘管還存在一些技術上的挑戰,但在過去的70年中,相同價格可購買到的計算量大約每兩年翻一番。框架

也就是說,構建計算力強大的人工智能系統愈加容易。然而,這受到了所提供或輸入的數據,以及處理時間的限制。能夠作以下思考:若是每臺計算機的能力都受到數據和時間的限制,咱們還能稱之爲智能計算機麼?機器學習

下面咱們簡單回顧一下人工智能的發展史。人類的智能主要包括概括總結和邏輯演繹,對應着人工智能中的聯結主義(如人工神經網絡)和符號主義(如吳文俊方法)。符號主義認爲智能是基於邏輯規則的符號操做;聯結主義認爲智能是由神經元構成的信息處理系統。其發展軌跡以下圖所示:分佈式

聯結主義,即「橙色陣營」在一開始處於領先地位,得益於其與神經科學和人類大腦之間的關係。人類大腦被視爲「強AI(Strong Artificial Intelligence)」和「通用人工智能(Artificial General Intelligence,AGI)」惟一的成功應用。然而,第一代神經網絡在處理實際問題時屢屢受挫。由於神經網絡多數是線性的,而且能力十分有限,深受外界質疑。與此同時,符號主義,即「藍色陣營」利用嚴謹的數學理論創造出了更多有用的東西。函數

隨着手工知識的積累,輸入或輸出數據量急速增加,系統的性能沒法適應需求,聯結主義逐漸衰敗。就比如法律,專家制定出再完備的規則都有可能相互衝突,此時便須要愈來愈多的「法官」來解決這些問題。這減緩了聯結主義的發展。工具

後來,「橙色陣營」獲取了足夠的標籤數據和計算資源,可以在可接受的時間內對網絡進行「訓練」,世界各地的研究學者開始進行大量試驗。儘管如此,聯結主義仍花費了大量的時間使大衆從新信任神經網絡,開發人員也花了較長才適應了模糊邏輯和統計的概念。性能

在對人工神經網絡進行詳細討論前,本文將先介紹一些其它方法:決策樹、機率模型、進化算法。

決策樹(Decision Tree)是最簡單有效的算法之一。其「學習」是經過順序地遍歷數據的每一個屬性並找到對特定輸出具備最大預測能力的屬性來執行的。像隨機森林這樣的高級變體使用了更復雜的學習技術,並在同一個模型中組合多個樹,它們的輸出是經過「投票」獲得的,這與人類的「直覺」相似。

機率模型(Probabilistic models)是統計方法的表明。機率模型與神經網絡常共享架構、學習/優化過程甚至符號。可是機率模型大多受機率邏輯(一般是貝葉斯)的約束,而神經網絡則無此約束。

進化算法(Evolutionary computation)最初是受到生物進化的啓發,且以隨機突變和適應度爲主。因爲修改一般是隨機的,其限制噪聲的效果突出。進化算法是一種引導式搜索,許多方面與退火過程相似。

上述方法有一個共同點:它們從較差的策略開始,逐漸對其改善,以期在某種性能評估方法中取得更好的分數。

現在,機器學習技術,尤爲是深度學習正在主導人工智能的發展。與大多數使用1到2箇中間抽象層(所謂的淺模型)機器學習方法不一樣,深度學習可能包含數百甚至數千個堆疊的可訓練層。

研究學者認爲對這樣的深度網絡進行訓練,須要全新的優化程序。事實證實,使用梯度降低的逆向傳播(即鏈式法則)便可很好的進行訓練,也可以使用Adam或RMSProp。

神經網絡訓練流程以下:
一、 獲取輸入
二、 計算輸出
三、 評估性能
四、 調節參數
五、 重複訓練,至性能最優

梯度降低法只需調整參數使偏差最小。但該方法容易使網絡陷入局部最優,而沒有得到最優性能。然而,最新研究代表許多神經網絡已經可以獲取全局最優解。

深度學習實現了訓練的並行化,即分佈式學習。能在同一時間跨多臺機器訓練相同的體系結構,同時實現梯度交換,加速超過1000倍。

此外,通過訓練的網絡能夠處理類似的任務,即遷移學習,這也是人工神經網絡普遍流行的重要緣由。例如,通過圖像分類訓練的網絡能夠用於其餘計算機視覺任務,天然語言處理和其餘領域。更重要的是,同一個網絡還能夠用來解決不一樣模式的問題。

強化學習(Reinforcement Learning,RL)則將它們結合在了一塊兒。RL的最初想法來自行爲心理學,科研人員探究了在行爲心理學中獎勵如何影響學習和塑造動物的行爲。

RL並不須要出現正確的輸入/輸出對,也不須要精確校訂次優化的行爲。舉個例子,咱們並不須要教會機器人如何精確移動,只需根據它走多遠或多快對其進行獎勵,它會本身找出正確的路線。然而,這種訓練模式在實踐中也是最具挑戰性的,即便是相對簡單的任務,一般也須要付出大量的努力才能正確設置。

在實際問題中,一般很難在環境中指定獎勵,研究人員目前更多地關注內部獎勵模型。

與RL並行的是逆向強化學習(Inverse Reinforcement Learning):當完成複雜的任務時,強化學習的回報函數很難指定,咱們但願有一種方法可以找到高效且可靠的回報函數,這種方法就是逆向強化學習。

通用人工智能中一些框架來自於嚴格的數學理論,一些受神經元迴路的啓發,還有一些基於心理模型。本文將以HTM、AIXI、ACT-R和SOAR爲例進行介紹。

層級實時記憶算法 (Hierarchical Temporal Memory,HTM),HTM算法旨在模擬新大腦皮層的工做原理,將複雜的問題轉化爲模式匹配與預測。它強調對「神經元」進行分層級,以及信息模式的空間特性與時間特性。

稀疏分佈表示(Sparse Distributed Representation, SDR)是HTM算法中的一個重要概念。實際上,它只是擁有幾千個元素的位數組。就像大腦中的信息老是經過億萬神經細胞中的小部分活躍細胞來表示同樣,HTM使用稀疏分佈表示語義相關的輸入。

HTM算法中的抑制(Inhibition)相似於批規範化和其餘一些正則化技術,提高(Boosting)在機器學習中已是一個相對較老的概念,層次結構(Hierarchical Structure)並無真正的大腦皮層的結構靈活。HTM對物體間關係的重視程度低,甚至連稀疏分佈表示也能夠用普通神經網絡構建。整體來講,HTM須要進行大量調整才能獲取與其它機器學習算法至關的性能。

接下來介紹AIXI,它是一個對通用人工智能的理論上的數學形式化表示。然而,它有一個顯著的缺點——沒法計算。事實上,許多機器學習算法均不能精確計算,只能作近似處理。AIXI表示以下:

AIXI的核心是一個強化學習智能體,在諸多方面與Schmidhuber開發的Godel Machine相似。然而,它們都是AGI的描述性模型,複雜程度高,沒法執行,但不能否認,它們都是人工智能研究人員的靈感源泉。
相反,ACT-R,即理性思惟的自適應控制系統 (AdaptiveControl of Thought—Rational),它不只是一種理論,並且是一種用LISP編寫的軟件框架。

ACT-R主要關注不一樣類型的內存,較少關注其中數據的轉換。該理論試圖理解人類如何得到和組織知識以及如何產生智力活動,其研究進展基於神經生物學研究成果並從中得以驗證,且已成功地爲許多不一樣認知現象創建起合理的模型。然而,它在實際應用中並未取得成功,最終只做爲研究人員的工具。SOAR與ACT-R有着類似的根源和基本假設,但它更關注於實現AGI,而不是創建人類認知的模型。

ACT-R和SOAR是人工智能符號主義的經典表明,在認知科學的發展中起到了重要做用,可是應用它們相比現代聯結主義須要更多的配置和先驗知識。此外,神經影像和其餘用於心智研究的工具愈加詳細和準確,並且ACT-R和SOAR在某必定程度上過於僵化,沒法保持相關性。



本文做者:【方向】

閱讀原文

本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索