判斷主成分個數

  • 判斷PCA中須要多少主成分
a、根據先驗經驗和理論知識判斷主成分數
b、根據要解釋變量方差的積累值的閾值來判斷須要的主成分數,如選擇使累積方差達到80%的主成分個數
c、經過檢查變量間 k*k 的相關係數矩陣來判斷保留的主成分數(根據相關係數矩陣的特徵值,選擇特徵值大於1的主成分)

一、最多見的是基於特徵值的方法
    每一個主成分都與相關係數矩陣的特徵值相關聯,第一主成分與最大的特徵值相關聯,第二主成分與第二大的特徵值相關聯,依此類推。Kaiser-Harris準則建議保留特徵值大於1的主成分,特徵值小於1的成分所解釋的方差比包含在單個變量中的方差更少

二、Cattell碎石檢驗
Cattell碎石檢驗則繪製了特徵值與主成分數的圖形。這類圖形能夠清晰的展現圖形彎曲情況,在圖形變化最大處之上的主成分均可以保留。

三、平行分析
還能夠進行模擬,依據初始矩陣相同大小的隨機數據矩陣來判斷要提取的特徵值,若基於真實數據的某個特徵值大於一組隨機數據矩陣相應的平均特徵值,那麼該主成分能夠保留

  • 對特徵值判別準則進行評價
fa.parallel()函數 同時對上述1~3的準則進行評價,對於11中評分(刪去了CONT變量),代碼以下
#同時對三種特徵判別準則進行評價
> library(psych)
> fa.parallel(USJudgeRatings[,-1],fa="pc",n.iter = 100, #n.iter 100個隨機數
+             show.legend = FALSE,main = "Scree plot with parallel analysis")#繪製的圖形以下
The estimated weights for the factor scores are probably incorrect.  Try a different factor extraction method.
Parallel analysis suggests that the number of factors =  NA  and the number of components =  1  #建議nfactors=1
 
相關文章
相關標籤/搜索