本文由 【AI前線】原創,原文連接:http://t.cn/RTzPO4A算法
當下,人工智能成了新時代的必修課,其重要性已無需贅述,但做爲一個跨學科產物,它包含的內容浩如煙海,各類複雜的模型和算法更是讓人望而生畏。對於大多數的新手來講,如何入手人工智能其實都是一頭霧水,好比到底須要哪些數學基礎、是否要有工程經驗、對於深度學習框架應該關注什麼等等。微信
那麼,學習人工智能該從哪裏開始呢?人工智能的學習路徑又是怎樣的?網絡
本文節選自王天一教授在極客時間 App 開設的「人工智能基礎課」,已獲受權。更多相關文章,請下載極客時間 App,訂閱專欄獲取。框架
數學基礎知識蘊含着處理智能問題的基本思想與方法,也是理解複雜算法的必備要素。今天的種種人工智能技術歸根到底都創建在數學模型之上,要了解人工智能,首先要掌握必備的數學基礎知識,具體來講包括:機器學習
線性代數:如何將研究對象形式化?函數
事實上,線性代數不只僅是人工智能的基礎,更是現代數學和以現代數學做爲主要分析方法的衆多學科的基礎。從量子力學到圖像處理都離不開向量和矩陣的使用。而在向量和矩陣背後,線性代數的核心意義在於提供了⼀種看待世界的抽象視角:萬事萬物均可以被抽象成某些特徵的組合,並在由預置規則定義的框架之下以靜態和動態的方式加以觀察。工具
着重於抽象概念的解釋而非具體的數學公式來看,線性代數要點以下:線性代數的本質在於將具體事物抽象爲數學對象,並描述其靜態和動態的特性;向量的實質是 n 維線性空間中的靜止點;線性變換描述了向量或者做爲參考系的座標系的變化,能夠用矩陣表示;矩陣的特徵值和特徵向量描述了變化的速度與方向。學習
總之,線性代數之於人工智能如同加法之於高等數學,是一個基礎的工具集。優化
機率論:如何描述統計規律?人工智能
除了線性代數以外,機率論也是人工智能研究中必備的數學基礎。隨着鏈接主義學派的興起,機率統計已經取代了數理邏輯,成爲人工智能研究的主流工具。在數據爆炸式增加和計算力指數化加強的今天,機率論已經在機器學習中扮演了核心角色。
同線性代數同樣,機率論也表明了一種看待世界的方式,其關注的焦點是無處不在的可能性。頻率學派認爲先驗分佈是固定的,模型參數要靠最大似然估計計算;貝葉斯學派認爲先驗分佈是隨機的,模型參數要靠後驗機率最大化計算;正態分佈是最重要的一種隨機變量的分佈。
數理統計:如何以小見大?
在人工智能的研究中,數理統計一樣不可或缺。基礎的統計理論有助於對機器學習的算法和數據挖掘的結果作出解釋,只有作出合理的解讀,數據的價值纔可以體現。數理統計根據觀察或實驗獲得的數據來研究隨機現象,並對研究對象的客觀規律作出合理的估計和判斷。
雖然數理統計以機率論爲理論基礎,但二者之間存在方法上的本質區別。機率論做用的前提是隨機變量的分佈已知,根據已知的分佈來分析隨機變量的特徵與規律;數理統計的研究對象則是未知分佈的隨機變量,研究方法是對隨機變量進行獨立重複的觀察,根據獲得的觀察結果對原始分佈作出推斷。
用一句不嚴謹但直觀的話講:數理統計能夠當作是逆向的機率論。 數理統計的任務是根據可觀察的樣本反過來推斷整體的性質;推斷的工具是統計量,統計量是樣本的函數,是個隨機變量;參數估計經過隨機抽取的樣原本估計整體分佈的未知參數,包括點估計和區間估計;假設檢驗經過隨機抽取的樣原本接受或拒絕關於整體的某個判斷,經常使用於估計機器學習模型的泛化錯誤率。
最優化理論: 如何找到最優解?
本質上講,人工智能的目標就是最優化:在複雜環境與多體交互中作出最優決策。幾乎全部的人工智能問題最後都會歸結爲一個優化問題的求解,於是最優化理論一樣是人工智能必備的基礎知識。最優化理論研究的問題是斷定給定目標函數的最大值(最小值)是否存在,並找到令目標函數取到最大值 (最小值) 的數值。 若是把給定的目標函數當作一座山脈,最優化的過程就是判斷頂峯的位置並找到到達頂峯路徑的過程。
一般狀況下,最優化問題是在無約束狀況下求解給定目標函數的最小值;在線性搜索中,肯定尋找最小值時的搜索方向須要使用目標函數的一階導數和二階導數;置信域算法的思想是先肯定搜索步長,再肯定搜索方向;以人工神經網絡爲表明的啓發式算法是另一類重要的優化方法。
信息論:如何定量度量不肯定性?
近年來的科學研究不斷證明,不肯定性就是客觀世界的本質屬性。換句話說,上帝還真就擲骰子。不肯定性的世界只能使用機率模型來描述,這促成了信息論的誕生。
信息論使用「信息熵」的概念,對單個信源的信息量和通訊中傳遞信息的數量與效率等問題作出瞭解釋,並在世界的不肯定性和信息的可測量性之間搭建起一座橋樑。
總之,信息論處理的是客觀世界中的不肯定性;條件熵和信息增益是分類問題中的重要參數;KL 散度用於描述兩個不一樣機率分佈之間的差別;最大熵原理是分類問題彙總的經常使用準則。
形式邏輯:如何實現抽象推理?
1956 年召開的達特茅斯會議宣告了人工智能的誕生。在人工智能的襁褓期,各位奠定者們,包括約翰·麥卡錫、赫伯特·西蒙、馬文·閔斯基等將來的圖靈獎得主,他們的願景是讓「具有抽象思考能力的程序解釋合成的物質如何可以擁有人類的心智。」通俗地說,理想的人工智能應該具備抽象意義上的學習、推理與概括能力,其通用性將遠遠強於解決國際象棋或是圍棋等具體問題的算法。
若是將認知過程定義爲對符號的邏輯運算,人工智能的基礎就是形式邏輯;謂詞邏輯是知識表示的主要方法;基於謂詞邏輯系統能夠實現具備自動推理能力的人工智能;不完備性定理向「認知的本質是計算」這一人工智能的基本理念提出挑戰。
《人工智能基礎課》整年目錄
本專欄將圍繞機器學習與神經網絡等核心概念展開,並結合當下火熱的深度學習技術,勾勒出人工智能發展的基本輪廓與主要路徑。
專欄訂閱指南
關注咱們的微信號"AI前線",後臺回覆「AI」可得到《AI前線》系列PDF電子書