哈爾濱工業大學計算機學院-模式識別-課程總結（四）-非線性判別函數

時間 2019-12-11

標籤哈爾濱工業大學計算機學院模式識別課程總結非線性判別函數简体版

原文原文鏈接

1. 非線性判別函數

本章介紹廣義線判別函數與核函數，並分析他們的不一樣。函數

對於非線性問題，咱們依舊可使用線性分類器進行求解。學習

廣義線性判別函數增長了特徵的高次項，將低維特徵轉化爲高維特徵。將低維線性不可分問題轉化爲高維的線性可分問題，並學習到高維空間下的線性分類器，該分類器其實等價於低維的非線性分類器。
以經典的異或問題爲例（線性不可分）：
- 對於該問題的二維輸入特徵，引入高維特徵\(x_1 * x_2\)，即對於二維座標（0，1）,轉化爲三維座標（0，1，0）。
  
  spa
- 在擴增的的三維高維空間中學習線性判別函數：
- 該線性函數等價於低維空間的非線性函數：
  3d
這麼作的弊端是，當引入的高維特徵後，會下降模型的泛化能力，易過擬合。
廣義線性判別函數的問題：
- 階數問題：對於一個具體問題，很難肯定判別函數的階數。
- 維數問題：當原始特徵維數較大時，會形成「維數災難」。

核函數雖然也是將特徵從低維空間映射到高維空間，可是能夠很好的避免廣義線性判別函數的維數災難問題。
接下來介紹核函數的主要思想，以後舉例介紹核函數是怎麼避免維數災難的。blog

對於下列輸入空間的非線性問題，經過非線性映射，轉化爲高維空間的線性可分問題：
非線性映射函數爲：
\[\Phi : \left( x _ { 1 } , x _ { 2 } \right) ^ { t } \rightarrow \left( x _ { 1 } ^ { 2 } , \sqrt { 2 } x _ { 1 } x _ { 2 } , x _ { 2 } ^ { 2 } \right) ^ { t }\]
計算特徵空間中兩個矢量的內積：
\[\begin{aligned} \Phi ( \mathbf { x } ) ^ { t } \Phi ( \mathbf { y } ) & = \left( x _ { 1 } ^ { 2 } , \sqrt { 2 } x _ { 1 } x _ { 2 } , x _ { 2 } ^ { 2 } \right) \left( y _ { 1 } ^ { 2 } , \sqrt { 2 } y _ { 1 } y _ { 2 } , y _ { 2 } ^ { 2 } \right) ^ { t } \\ & = x _ { 1 } ^ { 2 } y _ { 1 } ^ { 2 } + 2 x _ { 1 } x _ { 2 } y _ { 1 } y _ { 2 } + x _ { 2 } ^ { 2 } y _ { 2 } ^ { 2 } \\ & = \left( x _ { 1 } y _ { 1 } + x _ { 2 } y _ { 2 } \right) ^ { 2 } \\ & = \left( \mathbf { x } ^ { t } \mathbf { y } \right) ^ { 2 } \end{aligned}\]
定義核函數\(K ( \mathbf { x } , \mathbf { y } ) = \left( \mathbf { x } ^ { t } \mathbf { y } \right) ^ { 2 }\)，則有：
\[\Phi ( \mathbf { x } ) ^ { t } \Phi ( \mathbf { y } ) = K ( \mathbf { x } , \mathbf { y } )\]
在這個例子中，特徵空間中的內積，能夠用輸入空間的核函數計算獲得，從而不須要計算高維空間的矢量具體是什麼，也就避免的維數災難問題。

高斯 Gaussian RBF：\(K ( \mathbf { x } , \mathbf { y } ) = \exp \left( - \frac { \| \mathbf { x } - \mathbf { y } \| ^ { 2 } } { \sigma } \right)\)
多項式 Polynomial：\(K ( \mathbf { x } , \mathbf { y } ) = \left( \left( \mathbf { x } ^ { t } \mathbf { y } \right) + 1 \right) ^ { d }\)

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。