《機器學習(周志華)》筆記--緒論(2)--機器學習發展史與發展示狀

5、機器學習發展史算法

一、機器學習發展階段  數據庫

  (1)基礎奠基的熱烈時期: 20世紀50年代初到60年代中葉編程

  (2)停滯不前的冷靜時期: 20世紀60年代中葉到70年代末api

  (3)重拾但願的復興時期: 20世紀70年代末到80年代中葉網絡

  (4)現代機器學習的成型時期: 20世紀90年初到21世紀初機器學習

  (5)大放光芒的蓬勃發展時期: 21世紀初至今學習

二、機器學習發展史重要人物測試

                         

三、神經元結構spa

                                         

  要讓機器像人同樣學習,首先要了解大腦的神經元結構。設計

  生物神經元由胞體(Soma)、樹突(Dendrites),突觸(Synapse)和軸突(Axon)等構成。

  胞體是神經元的代謝中心,胞體通常生長有許多樹狀突起,稱爲樹突,它是神經元的主要接收器。胞體還延伸出一條管狀纖維組織,稱爲軸突。樹突是神經元的生物信號輸入端,與其它的神經元相連;軸突是神經元的信號輸出端,鏈接到其它神經元的樹突上。

  生物神經元有兩種狀態:興奮和抑制,平時生物神經元都處於抑制狀態,軸突無輸入,當生物神經元的樹突輸入信號大到必定程度,超過某個閾值時,生物神經元有抑制狀態轉爲興奮狀態,同時軸突向其它生物神經元發出信號。軸突的做用主要是傳導信息,傳導的方向是由軸突的起點傳向末端。一般,軸突的末端分出許多末梢,它們同後一個生物神經元的樹突構成一種稱爲突觸的機構。其中,前一個神經元的軸突末梢稱爲突觸的前膜,後一個生物神經元的樹突稱爲突觸的後膜;前膜和後膜二者之間的窄縫空間稱爲突觸的間隙,前一個生物神經元的信息由其軸突傳到末梢以後,經過突觸對後面各個神經元產生影響。

四、機器學習巨匠及算法發展歷程

  (1)唐納德·赫布(1904-1985)是加拿大著名生理心理學家。Hebb於1949年基於神經心理學的學習機制開啓機器學習的第一步,此後被稱爲Hebb學習規則。

                           

  hebb是一種無監督學習規則。Hebb的理論認爲在同一時間被激發的神經元間的聯繫會被強化。好比,鈴聲響時一個神經元被激發,在同一時間食物的出現會激發附近的另外一個神經元,那麼這兩個神經元間的聯繫就會強化,從而記住這兩個事物之間存在着聯繫。相反,若是兩個神經元老是不能同步激發,那麼它們間的聯繫將會愈來愈弱。

  (2)1950年,阿蘭·圖靈創造了圖靈測試來斷定計算機是否智能。圖靈測試認爲,若是一臺機器可以與人類展開對話(經過電傳設備)而不能被辨別出其機器身份,那麼稱這臺機器具備智能。這一簡化使得圖靈可以使人信服地說明「思考的機器」是可能的。

  (3)1952年,IBM 的 Arthur Samuel(被譽爲「機器學習之父」)在《Some Studies in Machine Learning Using the Game of Checkers》的論文中,定義並解釋了一個新詞——機器學習(Machine Learning,ML)。將機器學習非正式定義爲」在不直接針對問題進行編程的狀況下,賦予計算機學習能力的一個研究領域」。他還設計了一款能夠學習的西洋跳棋程序。它能經過觀察棋子的走位來構建新的模型,並用其提升本身的下棋技巧。Samuel 和這個程序進行多場對弈後發現,隨着時間的推移程序的棋藝變得愈來愈好。

  (4)1957年,羅森 布納特(Rosenblatt)發明了感知機(或稱感知器,Perceptron),是神經網絡的雛形,同時也是支持向量機的基礎,在當時引發了不小的轟動。感知機是二類分類的線性分類模型,其輸入爲實例的特徵向量,輸出爲實例的類別,取+1和-1二值。感知機對應於輸入空間(特徵空間)中將實例劃分爲正負兩類的分離超平面,屬於判別模型。感知機學習旨在求出將訓練數據進行線性劃分的分離超平面。

                                                       

  (5)1960年,Widrow(維德羅)發明了Delta學習規則,它是一種簡單的有監督學習算法,即現在的最小二乘問題,該算法根據神經元的實際輸出與指望輸出差異來調整鏈接權。該算法被應用到感知機中,而且獲得了一個極好的線性分類器。

                                                                      

                                                                   

  (6)1969年,馬文·明斯基(Minskey)將感知機推到最高頂峯。他提出了著名的XOR問題感知機數據線性不可分的情形,論證了感知器在相似XOR問題的線性不可分數據的無力,以致於其後十年被稱爲「冷靜時期」,給感知機畫上了一個逗號,以洪荒之力將如火如荼將的ML暫時封印了起來,Rosenblatt在這以後兩年鬱鬱而終與此也不無關係。

                                                        

  (7)1970年,Seppo Linnainmaa(林納因馬)首次完整地敘述了自動鏈式求導方法(Automatic Differentiation,AD),是著名的反向傳播算法(Back Propagation,BP)的雛形,但在當時並無引發重視。

                                                          

   (8)1974年,Werbos(偉博斯)首次提出把BP算法的思想應用到神經網絡,也就是多層感知機(Multilayer Perception,MLP),MLP或者稱爲人工神經網絡(Artificial Neural Network,ANN),是一個帶有單隱層的神經網絡。

                                                                       

  事實上,這個時期整個AI領域都遭遇了瓶頸。當時的計算機有限的內存和處理速度不足以解決任何實際的AI問題。要求程序對這個世界具備兒童水平的認識,研究者們很快發現這個要求過高了:1970年沒人可以作出如此巨大的數據庫,也沒人知道一個程序怎樣才能學到如此豐富的信息。

  感知機也成爲單個神經元結構,神經元也成爲單層感知機。

  (9)1980年,在美國的卡內基梅隆大學(CMU)召開了第一屆機器學習國際研討會,標誌着機器學習研究已在全世界興起。

  (10)1985-1986年,Rumelhart,Hinton等許多神經網絡學者成功實現了實用的BP算法來訓練神經網絡,並在很長一段時間內BP都做爲神經網絡訓練的專用算法。

                                        

   (11)1986年,昆蘭提出了另外一個一樣著名的ML算法:決策樹算法(ID3),決策樹做爲一個預測模型,表明的是對象屬性與對象值之間的一種映射關係,並且緊隨其後涌現出了不少相似或者改進算法,如ID4,迴歸樹,CART等。

  例:銀行根據客戶的房產狀況,婚姻情況以及收入情況來評估客戶償還貸款的能力。

                                 

   (12)1995年,Yan LeCun提出了卷積神經網絡(CNN),受生物視覺模型的啓發,一般有至少兩個非線性可訓練的卷積層,兩個非線性的固定卷積層,模擬視覺皮層中的V1和V2中的Simple cell和Complex cell,在手寫字識別等小規模問題上,取得了當時世界最好結果,可是在大規模問題上表現不佳。(V1區負責邊緣檢測,V2區負責形狀檢測。局部鏈接,權值共享)

                                    

  (13)1995年,Vapnik和Cortes(瓦普尼克和科爾特斯)欲找到具備「最大間隔」的決策邊界,提出了強大的支持向量機(SVM),主要思想是用一個分類超平面將樣本分開從而達到分類效果,具備很強的理論論證和實驗結果。

                                                               

   (14) 1997年,Freund和Schapire(弗洛恩德和夏皮雷)提出了另外一個堅實的ML模型AdaBoost(集成學習),該算法最大的特色在於組合弱分類器造成強分類器,能夠形象地表述爲:「三個臭皮匠勝過諸葛亮」,分類效果比其它強分類器更好。

                                       

   (15)2001年,隨着核方法的提出,SVM大佔上風,它的主要思想就是經過將低維數據映射到高維,從而實現線性可分。

                                       

  (16) 2006年,Hinton(辛頓)他的學生在《Nature》上發表了一篇文章,提出的深度置信網絡(Deep Belief Network,DBN)開啓了深度學習新紀元。

            

  深度學習主要算法:   

     (1)CNN:卷積神經網絡

   (2)RNN:循環神經網絡

   (3)ResNet:殘差網絡

 6、應用現狀

  機器學習中比較活躍的四大應用領域:

    (1)數據挖掘,發現數據之間的關係

    (2)計算機視覺,像人同樣看懂世界

    (3)天然語言處理,像人同樣看懂文字

    (4)機器人決策,像人同樣具備決策能力

相關文章
相關標籤/搜索