臺大機器學習基石(1)

臺大機器學習基石(1)

機器學習對於適用場景有必定的前提條件:算法

  1. 能夠找到某種模式
  2. 不容易編程實現,不能對目標下一個簡單的定義
  3. 能找到訓練的數據,數據量越大越好

使用機器學習的一個小例子——銀行信用卡批准
例如銀行會收到申請客戶的我的資料,而後根據我的信息進行分析,選擇是否發放信用卡,以達到銀行最大收益。編程

機器學習所扮演的角色就是訓練出某種髮卡策略。機器學習

數學描述:函數

  1. X:用戶我的資料
  2. Y:是否要髮卡
  3. 目標函數F:X->Y(F爲目標函數,經過用戶資料,得出是否髮卡的策略)
  4. 訓練數據D={(X1,Y1),(X2,Y2)...}
  5. 假設Hypothesis:G:X->Y的表現很好

以下圖可以形象的表現出機器學習的數學過程。學習

這裏面有個隱含的過程,也就是D數據集其實是由某種理想化(不可知)的公式F演算獲得的.大數據

而機器學習的過程也只是在不斷逼近,試圖獲得F,可是隻能獲得它的近似函數G,G約等於F。人工智能

那麼在這個例子裏,G會是怎麼樣的一種形式呢?接下來,就具體的講一講。blog

我的資料包含:年齡、性別、年收入、居住時間、工齡、負債。數學

G屬於假設集合H{h1,h2,h3...}數據挖掘

h1:年收入>20萬

h2:負債>8萬

h3:工齡<=2年

......

機器學習過程就是爲G挑集合H中選擇最好的一個。

機器學習的模型就是指:演算法A與假設集合H。

所以總結:機器學習,根據數據D,計算出假設G,約等於目標函數F。

概念區分

機器學習與數據挖掘的關係

  1. 首先從二者的目標角度來說,機器學習是經過數據找到某種Pattern,找到近似函數G;而數據挖掘則是經過數據找到當中有趣的元素。可是某些狀況下,它們並不區分,由於有趣的元素能夠是這個Pattern,這時它們的目標相同。
  2. 而後從它們的訓練過程來說,都是須要喂數據的。
  3. 接着,是因爲數據挖掘的特色:數據挖掘是在大數據方面切入的,因此更加註重大數據的高效計算。
  4. 最後,它們之間是互相促進的,有時候發現了G,那也能幫助找到有趣重要的元素,反之也是。

機器學習與人工智能的關係

1.機器學習是實現人工智能的一種方式。

機器學習與統計學的關係

  1. 統計是實現機器學習的一種方法。
  2. 傳統的統計學是從數學出發,更加註重假設與證實;機器學習從電腦出發,更注重怎麼計算處理,而不僅是數學上的證實等。
相關文章
相關標籤/搜索