假設空間H(Hypothesis Set)函數
輸入空間D(X1...Xn)大數據
1.增加函數(grown function)io
是關於輸入空間尺寸n的函數function
假設空間對於D中全部實例實現分類(賦予標記)的分類方式的最大種數(有多少種分類方式)im
最大值爲2^n,可是不少增加函數都達不到最大值。數據
2.對分(dichotomies)img
H對D的一種分類方式就是一種對分di
3.打散(shatter)poi
H能實現D上所有n個實例的所有對分,就是打散,不能實現就是不打散。co
4.Break Point
當n增大到一個值m時,增加函數就不能達到最大值2^n,m就是Break point,也就是第一個不打散的n
5.VC維
假設空間H的VC維是能被H打散的最大的示例集(數據集)的大小,即有: 其中
爲假設空間在數據集大小爲m時的增加函數。
對於一個假設空間H,若是存在m個數據樣本可以被假設空間H中的函數按全部可能的 種形式分開 ,則稱假設空間H可以把m個數據樣本打散(shatter)。假設空間H的VC維就是能打散的最大數據樣本數目m。若對任意數目的數據樣本都有函數能將它們shatter,則假設空間H的VC維爲無窮大。