三張圖讀懂機器學習:基本概念、五大流派與九種常見算法

引言算法

 

「機器學習正在進步,咱們彷佛正在不斷接近咱們心中的人工智能目標。語音識別、圖像檢測、機器翻譯、風格遷移等技術已經在咱們的實際生活中開始獲得了應用,但機器學習的發展仍還在繼續,甚至被認爲有可能完全改變人類文明的發展方向乃至人類自身。但你瞭解如今正在發生的這場變革嗎?四大會計師事務所之一的普華永道(PwC)近日發佈了多份解讀機器學習基礎的圖表,其中介紹了機器學習的基本概念、原理、歷史、將來趨勢和一些常見的算法。爲便於讀者閱讀,機器之心對這些圖表進行了編譯和拆分,分三大部分對這些內容進行了呈現,其中也加入了一些擴展連接,但願能幫助你進一步擴展閱讀。」編程

 

1、機器學習概覽設計模式

 

1. 什麼是機器學習?服務器

機器經過分析大量數據來進行學習。好比說,不須要經過編程來識別貓或人臉,它們能夠經過使用圖片來進行訓練,從而概括和識別特定的目標。網絡

 

2. 機器學習和人工智能的關係架構

機器學習是一種重在尋找數據中的模式並使用這些模式來作出預測的研究和算法的門類。機器學習是人工智能領域的一部分,而且和知識發現與數據挖掘有所交集。dom

更多解讀可參閱《一文讀懂機器學習、數據科學、人工智能、深度學習和統計學之間的區別》機器學習

 

 

3. 機器學習的工做方式函數

①選擇數據:將你的數據分紅三組:訓練數據、驗證數據和測試數據性能

②模型數據:使用訓練數據來構建使用相關特徵的模型

③驗證模型:使用你的驗證數據接入你的模型

④測試模型:使用你的測試數據檢查被驗證的模型的表現

⑤使用模型:使用徹底訓練好的模型在新數據上作預測

⑥調優模型:使用更多數據、不一樣的特徵或調整過的參數來提高算法的性能表現

 

 

4. 機器學習所處的位置

①傳統編程:軟件工程師編寫程序來解決問題。首先存在一些數據→爲了解決一個問題,軟件工程師編寫一個流程來告訴機器應該怎樣作→計算機遵守這一流程執行,而後得出結果

②統計學:分析師比較變量之間的關係

③機器學習:數據科學家使用訓練數據集來教計算機應該怎麼作,而後系統執行該任務。首先存在大數據→機器會學習使用訓練數據集來進行分類,調節特定的算法來實現目標分類→該計算機可學習識別數據中的關係、趨勢和模式

④智能應用:智能應用使用人工智能所獲得的結果,如圖是一個精準農業的應用案例示意,該應用基於無人機所收集到的數據

 

 

5. 機器學習的實際應用

機器學習有不少應用場景,這裏給出了一些示例,你會怎麼使用它?

  • 快速三維地圖測繪和建模:要建造一架鐵路橋,PwC 的數據科學家和領域專家將機器學習應用到了無人機收集到的數據上。這種組合實現了工做成功中的精準監控和快速反饋。

  • 加強分析以下降風險:爲了檢測內部交易,PwC 將機器學習和其它分析技術結合了起來,從而開發了更爲全面的用戶概況,而且得到了對複雜可疑行爲的更深度瞭解。

  • 預測表現最佳的目標:PwC 使用機器學習和其它分析方法來評估 Melbourne Cup 賽場上不一樣賽馬的潛力。

 

 

2、機器學習的演化

 

幾十年來,人工智能研究者的各個「部落」一直以來都在彼此爭奪主導權,參閱機器之心文章《華盛頓大學教授 Pedro Domingos:機器學習領域五大流派(附演講 ppt)》。如今是這些部落聯合起來的時候了嗎?他們也可能不得不這樣作,由於合做和算法融合是實現真正通用人工智能(AGI)的惟一方式。這裏給出了機器學習方法的演化之路以及將來的可能模樣。擴展閱讀《深度 | 深度學習與神經網絡全局概覽:核心技術的發展歷程》

 

1. 五大流派

①符號主義:使用符號、規則和邏輯來表徵知識和進行邏輯推理,最喜歡的算法是:規則和決策樹

②貝葉斯派:獲取發生的可能性來進行機率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫

③聯結主義:使用機率矩陣和加權神經元來動態地識別和概括模式,最喜歡的算法是:神經網絡

④進化主義:生成變化,而後爲特定目標獲取其中最優的,最喜歡的算法是:遺傳算法

⑤Analogizer:根據約束條件來優化函數(儘量走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機

 

 

2. 演化的階段

1980 年代

  • 主導流派:符號主義

  • 架構:服務器或大型機

  • 主導理論:知識工程

  • 基本決策邏輯:決策支持系統,實用性有限

1990 年代到 2000 年

  • 主導流派:貝葉斯

  • 架構:小型服務器集羣

  • 主導理論:機率論

  • 分類:可擴展的比較或對比,對許多任務都足夠好了

2010 年代早期到中期

  • 主導流派:聯結主義

  • 架構:大型服務器農場

  • 主導理論:神經科學和機率

  • 識別:更加精準的圖像和聲音識別、翻譯、情緒分析等

 

 

 

3. 這些流派有望合做,並將各自的方法融合到一塊兒

2010 年代末期

  • 主導流派:聯結主義+符號主義

  • 架構:許多雲

  • 主導理論:記憶神經網絡、大規模集成、基於知識的推理

  • 簡單的問答:範圍狹窄的、領域特定的知識共享

2020 年代+

  • 主導流派:聯結主義+符號主義+貝葉斯+……

  • 架構:雲計算和霧計算

  • 主導理論:感知的時候有網絡,推理和工做的時候有規則

  • 簡單感知、推理和行動:有限制的自動化或人機交互

2040 年代+

  • 主導流派:算法融合

  • 架構:無處不在的服務器

  • 主導理論:最佳組合的元學習

  • 感知和響應:基於經過多種學習方式得到的知識或經驗採起行動或作出回答

 

 

 

3、機器學習的算法

 

 

你應該使用哪一種機器學習算法?這在很大程度上依賴於可用數據的性質和數量以及每個特定用例中你的訓練目標。不要使用最複雜的算法,除非其結果值得付出昂貴的開銷和資源。這裏給出了一些最多見的算法,按使用簡單程度排序。更多內容可參閱機器之心的文章《機器學習算法集錦:從貝葉斯到深度學習及各自優缺點》《經驗之談:如何爲你的機器學習問題選擇合適的算法?》

 

1. 決策樹(Decision Tree):在進行逐步應答過程當中,典型的決策樹分析會使用分層變量或決策節點,例如,可將一個給定用戶分類成信用可靠或不可靠。

 

 

 

2. 支持向量機(Support Vector Machine):基於超平面(hyperplane),支持向量機能夠對數據羣進行分類。

 

 

3. 迴歸(Regression):迴歸能夠勾畫出因變量與一個或多個因變量之間的狀態關係。在這個例子中,將垃圾郵件和非垃圾郵件進行了區分。

 

  • 優勢:迴歸可用於識別變量之間的連續關係,即使這個關係不是很是明顯

  • 場景舉例:路面交通流量分析、郵件過濾

 

 

4. 樸素貝葉斯分類(Naive Bayes Classification):樸素貝葉斯分類器用於計算可能條件的分支機率。每一個獨立的特徵都是「樸素」或條件獨立的,所以它們不會影響別的對象。例如,在一個裝有共 5 個黃色和紅色小球的罐子裏,連續拿到兩個黃色小球的機率是多少?從圖中最上方分支可見,先後抓取兩個黃色小球的機率爲 1/10。樸素貝葉斯分類器能夠計算多個特徵的聯合條件機率。

 

  • 優勢:對於在小數據集上有顯著特徵的相關對象,樸素貝葉斯方法可對其進行快速分類

  • 場景舉例:情感分析、消費者分類

 

5. 隱馬爾可夫模型(Hidden Markov model):顯馬爾可夫過程是徹底肯定性的——一個給定的狀態常常會伴隨另外一個狀態。交通訊號燈就是一個例子。相反,隱馬爾可夫模型經過分析可見數據來計算隱藏狀態的發生。隨後,藉助隱藏狀態分析,隱馬爾可夫模型能夠估計可能的將來觀察模式。在本例中,高或低氣壓的機率(這是隱藏狀態)可用於預測晴天、雨天、多雲天的機率。

 

  • 優勢:允許數據的變化性,適用於識別(recognition)和預測操做

  • 場景舉例:面部表情分析、氣象預測

 

 

6. 隨機森林(Random forest):隨機森林算法經過使用多個帶有隨機選取的數據子集的樹(tree)改善了決策樹的精確性。本例在基因表達層面上考察了大量與乳腺癌復發相關的基因,並計算出復發風險。

 

 

7. 循環神經網絡(Recurrent neural network):在任意神經網絡中,每一個神經元都經過 1 個或多個隱藏層來將不少輸入轉換成單個輸出。循環神經網絡(RNN)會將值進一步逐層傳遞,讓逐層學習成爲可能。換句話說,RNN 存在某種形式的記憶,容許先前的輸出去影響後面的輸入。

 

  • 優勢:循環神經網絡在存在大量有序信息時具備預測能力

  • 場景舉例:圖像分類與字幕添加、政治情感分析

 

8. 長短時間記憶(Long short-term memory,LSTM)與門控循環單元神經網絡(gated recurrent unit nerual network):早期的 RNN 形式是會存在損耗的。儘管這些早期循環神經網絡只容許留存少許的早期信息,新近的長短時間記憶(LSTM)與門控循環單元(GRU)神經網絡都有長期與短時間的記憶。換句話說,這些新近的 RNN 擁有更好的控制記憶的能力,容許保留早先的值或是當有必要處理不少系列步驟時重置這些值,這避免了「梯度衰減」或逐層傳遞的值的最終 degradation。LSTM 與 GRU 網絡使得咱們可使用被稱爲「門(gate)」的記憶模塊或結構來控制記憶,這種門能夠在合適的時候傳遞或重置值。

 

 

9. 卷積神經網絡(convolutional neural network):卷積是指來自後續層的權重的融合,可用於標記輸出層。

 

 

本文由機器之心編譯自PwC,原做者:Alan Morrison、Anand Rao

相關文章
相關標籤/搜索