PCA降維大綱

PCA降維主要依靠找出特徵向量的前k個主成分,將特徵向量由n維縮減到k維(k<<n),同時保證信息沒有太大的丟失,如何選出主成分,根據常理,數據分散要比數據密集更易區分些,因此根據原始數據映射到各個主成分上時,得到的方差的大小來確定主成分的優先級。 主要途徑就是通過協方差矩陣(協方差矩陣主對角線是各個特徵的特徵值方差,其餘數值爲兩兩特徵之間的協方差,協方差表示兩個數據的相關程度,爲0則不相關,爲1
相關文章
相關標籤/搜索