2017/7/19 朱興全教授學術講座觀點與總結第一講

前言    WHY?AI是從策略出發簡單可描述(能夠用清晰的規則和算法取實現)的任務,讓機器去執行。咱們但願複雜難以描述的任務(如無人駕駛,語音識別等狀況複雜,須要推理和抽象化的任務)也能夠由機器去實現ML/DL是從數據驅動出發。數據挖掘、模式識別、機器學習和神經網絡都是用來解決這些複雜的狀況下的任務(幾者之間互相聯繫,相關關聯,甚至區別不大)。html

 


 

1、模式識別算法

 

解決問題:如何讓機器作與人感知相關的任務?認知模型、區分模式,從而造成正確的判決(聚類與系統推薦)網絡

①類人的觀察②感知環境中感興趣的部分(特徵抽取與整合)③做出與人推理相近的判決。app

舉例:如何區分兩種魚?機器學習

典型的決策機制函數

  • 選擇可分類的有用特徵(魚臉?特徵抽取困難;魚的味道?長度?寬?形狀等等)
  • 可測量的穩定特徵(魚的亮度,受光照的影響;長度是一個穩定的可測量特徵)
  • 步驟:得到圖像、分離魚、進行測量、做出判斷。

 

特徵選擇學習

咱們知道兩種魚的長度通常不同,能夠做爲區分的特徵,須要選擇長度的閾值,同時,咱們也能夠看到通常魚的長度是不同,可是並非嚴格不一樣,即長度不能徹底區分兩種魚,此時咱們考慮嘗試其餘的特徵。機器學習中①並不存在單一特徵能夠區分類別,採用多個特徵進行組合分析(整個狀況就更加複雜)②假定各個特徵之間獨立,儘量選擇特徵之間互相獨立的特徵(避免相關性,可是每每實際中,特徵之間是相關的,如身高和體重),儘量考慮多的特徵。
大數據

特徵維數變多出現的問題:一是模型更加複雜(容易過擬合)。二是學習的效率降低。spa

 

指望提取的特徵:可以區分類別,選擇好的特徵可以正確區分類別(差的特徵可能沒法區別類別)3d

特徵提取的方法有兩種:一種是Feature extraction 即特徵映射?經過函數映射到新的特徵空間,新的特徵空間採用矢量表示特徵,能夠體現或者容易比較二者(二者只類別仍是特徵之間呢?)之間的相關性。另外一種是特徵選擇,在若干特徵中選擇一部分。

 tradeoff:依據判別結果所付出的代價對模型進行調整(例如:salmon的價格高於sea bass時,咱們把分類曲線往左移,那麼對於salmon的判斷基本不會出錯,不會發生顧客用高價錢買到的倒是sea bass,不會有上當受騙的嫌疑。有可能使用低價錢買到salmon(salmon被斷定爲sea bass時),這個時候顧客就會很高興,下次會繼續過來這裏買魚,即咱們但願salmon的正確率必定要保證)

 

模型好壞的度量:

(ROC與AUC?)


 

2、機器學習

 機器能夠替代人的技能

 

機器學習是使用大量數據去學習模型。機器考慮特徵與結果的相關性比人要好,人能夠考慮影響結果的2到3個特徵,機器能夠考慮不少個影響因素。

爲何用機器學習?從特定的樣例中學習數據的通常模型,數據豐富且便宜,知識少而昂貴。創建一個模型去很好而且有效的近似數據

機器學習模型:

一、監督學習(決策樹、前向神經網絡和反向傳播)  有監督模型的優勢是提供標籤,準確率高。

二、無監督學習(聚類、關聯分析)  無監督學習不須要標籤,因此數據數量能夠很大很大,優勢是適用大數據。

三、Reinforcement learning   http://www.cse.unsw.edu.au/~cs9417ml/RL1/applet.html

 

機器學習的輸出:

 


 

3、神經網絡

神經元

 

 神經網絡

神經網路主要是學習權重,怎麼樣獲得好的權重去完成任務(怎麼修改權重?誰先改?)。生物依據,只是概念上同樣,功能上並不一樣。同一層之間不相鏈接,彼此之間改變互不影響,模型簡單。隱藏層(hidden):咱們不能肯定它應該輸出是怎麼樣,不能預測它真實的輸出。輸入和輸出是能夠獲得預測的輸入與輸出,而且能夠與真實的輸出進行對比。

Why Deep Learning?

Deep Learning能夠經過input對每一層學習獲得的進行解釋,隱藏層能夠解釋(如某一層表示邊緣,即每一層都有必定的歸結,DL每每每一層能夠表示出來,區分DL與傳統NN的區別)

 


 

區別與關係

 原來知道哪些特徵好,就用那些特徵,如今不知道,讓它本身學習哪些特徵好(特徵   →   學習新的特徵)。

 

相關文章
相關標籤/搜索