機器學習——特徵工程之主成分分析PCA

一、PCA簡介 1、 定義:主成分分析是一種統計方法,通過正交變換將一組可能存在相關性的變量轉換爲線性不相關,轉換後的這組變量稱爲主成分。 2、 主要應用場景:數據壓縮;消除冗餘;消除數據噪聲;數據降維,可視化 3、 理論基礎:最大投影方差理論、最小投影距離理論和座標軸相關度理論 4、 直觀理解:找出數據裏最主要的成分,代替原始數據並使損失儘可能的小     a) 樣本點到超平面的距離足夠近  
相關文章
相關標籤/搜索