經常使用的成分分析有PCA和FDA,本章主要介紹主成分分析PCA,對於FDA,只是簡要介紹其主要數學思想。
進行成分分析的目的是對數據集特徵進行降維,降維的好處有:算法
提升泛化能力:減小模型的參數數量。每每數據特徵維度越高,模型越容易過擬合。函數
融入核函數的SVM,雖然是在高維特徵空間下學習分類界面,可是因爲SVM的VC維受分類界面與樣本控制,所以不會增大其VC維,也就不會下降模型的泛化能力。學習
PCA的其它名稱:離散K-L變換,Hotelling變換。優化
PCA從儘可能減小信息損失的角度實現降維。spa
PCA的優化問題: \(\min _ { \mathbf { e } _ { 1 } , \cdots , \mathbf { e } _ { d } } J \left( \mathbf { e } _ { 1 } , \cdots , \mathbf { e } _ { d } \right) = \frac { 1 } { n } \sum _ { k = 1 } ^ { n } \left\| \mathbf { x } _ { k } - \hat { \mathbf { x } } _ { k } \right\| ^ { 2 }\)blog
如圖所示,座標A降維到新的座標系下紅色虛線指向的一維座標。(選擇\(e_1\)做爲新座標系的基向量)排序
而FDA則是在可分性最大意義下的最優線性映射,充分保留了樣本的類別可分性信息。數學
三類問題的FDA可視化:
class