【譯】SVM零基礎系列教程(一)

英文原文連接:SVM - Understanding the math - Part 1 - The margin算法

譯者注:本人研一,項目緣由須要瞭解SVM知識,奈何向量相關知識全都還給本科老師,這一部分徹底沒看懂,直到看到了國外某博客寫的這個SVM系列教程,深刻淺出,只要有初中數學基礎便可看懂,特別適合我這樣的。因而翻譯該系列教程,幫助和我同樣經歷的同窗早日掌握SVM。學習


全系列目錄:spa

  • 小白學SVM系列教程(一)——間隔(margin)翻譯

  • 小白學SVM系列教程(二)——向量教程

  • 小白學SVM系列教程(三)——最優超平面ip


介紹

這是我寫的SVM背後的數學原理系列文章的第一篇。有許多人說要了解SVM,充分的數學背景知識是必要的,不過我將盡可能由淺入深慢慢地講解,以便每個細節都是清楚明白的,甚至對於初學者來講也可以理解。get

支持向量機(SVM)的目標是什麼?

支持向量機的目標是找出可以最大化訓練集數據間隔(margin)的最優分類超平面。博客

首先,咱們可以從定義中看出SVM須要訓練數據,也就是說它是一種監督學習算法。數學

知道SVM是一種分類算法也是十分重要的,這意味着咱們將使用它去預測某個東西是否屬於特定的類別。it

例如,咱們擁有以下的訓練數據:

訓練數據散點圖
咱們已經繪製了人羣的身高和體重散點圖,也用不一樣的標記區分了男人和女人。

有了這些數據,咱們將可以使用SVM回答下面幾個問題:

給定一個具體的數據點(身高和體重),這我的是男人仍是女人?
例如:若是知道某人身高175cm體重80kg,這我的是男人仍是女人?

什麼是分類超平面?

經過觀察上圖,咱們可以發現分類這些數據是可能的。例如,咱們能夠描繪一條直線而後全部表明男人的點都在直線的上邊,表明女人的點都在直線的下邊。

這條直線被稱爲分類超平面,以下圖所示:

clipboard.png

若是它就是一條線,爲何咱們稱它爲超平面呢?

超平面是平面的抽象。

  • 在一維空間,超平面是一個點

  • 在二維空間,它是一條線

  • 在三位空間,它是一個面

  • 在更高維度上,你可以稱它爲超平面

直線分類超平面

在一維空間中,點L是一個分類超平面。

什麼是最優分類超平面?

你可以找到一個分類超平面,但這並不意味着它是最好的那個!在下面的例子中有幾個分類超平面,每一個都成功地將咱們的數據集分類爲男人和女人兩部分。

clipboard.png

存在許多的分類超平面

假設咱們選擇綠色的超平面而且使用它給真實數據分類。

clipboard.png

這個超平面並不可以很好的分類數據。

此次,它分類出現了錯誤。明顯,咱們可以看出,若是咱們選擇了一個靠近某一類數據點的超平面,它也許並不能很好地分類數據。

所以咱們將會嘗試選擇一個儘量遠離每一種類別數據點的超平面:

clipboard.png

這一個看起來更好。當咱們用它分類真實數據中時,它仍然進行了完美的分類。

clipboard.png
黑色的超平面比綠色的超平面分類更準確。

這就是爲何SVM的目標是尋找最優分類超平面

  • 由於它可以正確地分類訓練數據

  • 同時由於它能更準確地分類還沒有出現的數據。

什麼是間隔和它是如何幫助選擇最優超平面?

clipboard.png

咱們的最優超平面的間隔

給定一個超平面,咱們可以計算出超平面到最近的一個點的距離。一旦咱們算出這個值,若是咱們將距離乘以2咱們就能夠獲得間隔(margin)。

基本上,間隔是一個「無人區」。在間隔內不存在任何數據點。

對於另外一個超平面,間隔將看起來像這樣:

clipboard.png

如圖所示,間隔B比間隔A小得多。

咱們可以觀察到如下結果:

  • 若是一個超平面十分接近某個數據點,它的間隔將很小

  • 超平面距離數據點越遠,間隔就越大

這意味着最優超平面將是擁有最大邊距的那個超平面

這也是爲何SVM的目標是找到最大化訓練集數據間隔的最優分類超平面


到這裏關於SVM背後的數學原理的介紹就結束了,目前沒有有多少公式,可是在下篇文章咱們將增長一些數字而後試着從數學的視角(幾何和向量)來進行理解。

相關文章
相關標籤/搜索