VC維相關知識

假設空間H(Hypothesis Set)函數

輸入空間D(X1...Xn)大數據

 

1.增加函數(grown function)io

是關於輸入空間尺寸n的函數function

假設空間對於D中全部實例實現分類(賦予標記)的分類方式的最大種數(有多少種分類方式)im

最大值爲2^n,可是不少增加函數都達不到最大值。數據

2.對分(dichotomies)img

H對D的一種分類方式就是一種對分di

3.打散(shatter)poi

H能實現D上所有n個實例的所有對分,就是打散,不能實現就是不打散。co

4.Break Point

當n增大到一個值m時,增加函數就不能達到最大值2^n,m就是Break point,也就是第一個不打散的n

5.VC維

假設空間H的VC維是能被H打散的最大的示例集(數據集)的大小,即有: VC(H)=max\{m:\prod(m)=2^m\} 其中\prod(m) 爲假設空間在數據集大小爲m時的增加函數。

對於一個假設空間H,若是存在m個數據樣本可以被假設空間H中的函數按全部可能的2^h 種形式分開 ,則稱假設空間H可以把m個數據樣本打散(shatter)。假設空間H的VC維就是能打散的最大數據樣本數目m。若對任意數目的數據樣本都有函數能將它們shatter,則假設空間H的VC維爲無窮大。

 
參考:https://www.zhihu.com/question/38607822/answer/149407083
相關文章
相關標籤/搜索