PLSC(Partial Least Square Correlation)偏最小二乘相關

21-1  爲了探討小學生的生長髮育指標與身體素質的相互關係,某市對小學生的體質進行了調查。現僅對8410歲男孩的四項生長髮育指標(x1~x4):肺活量、身高、體重、胸圍與四項反映身體素質的指標(y1~y4):50m跑、跳高、跳遠、實心球擲遠 web

> can=read.csv('d:/can.csv') 
> can=as.matrix(can)
> canx=can[,1:4] #將前4列提取做爲生長髮育矩陣
> cany=can[,5:8] #將後4列提取做爲身體素質矩陣
> zcanx=scale(canx) # 對生長髮育矩陣進行預處理(標準化)
> zcany=scale(cany) # 身體素質矩陣進行預處理(標準化)
# 對生長髮育矩陣和身體素質矩陣進行預處理(標準化)
> rcan=cor(zcanx,zcany) #求兩個矩陣的相關矩陣          
           [,1]      [,2]      [,3]      [,4]
[1,] -0.2517700 0.6190052 0.5034716 0.6118385
[2,] -0.2002181 0.7669638 0.6395279 0.6539121
[3,] -0.2588718 0.7342691 0.6436623 0.6920838
[4,] -0.3246189 0.7471478 0.7168594 0.6995147
> svd(rcan) #求相關矩陣的奇異值分解
$d
[1] 2.38563882 0.09572188 0.07063975 0.01184736 #考慮只取第一個奇異值2.38563882,由於

$u
           [,1]        [,2]       [,3]       [,4]
[1,] -0.4337134  0.29001402 -0.7789772 -0.3478204
[2,] -0.5063352 -0.78981273  0.1309404 -0.3204296
[3,] -0.5132588 -0.03386998 -0.1067725  0.8508924
[4,] -0.5404468  0.53938905  0.6038615 -0.2287530
$v
           [,1]        [,2]        [,3]       [,4]
[1,]  0.2175019 -0.84839441  0.02154499  0.4821366
[2,] -0.6025536 -0.50253877 -0.12727051 -0.6067834
[3,] -0.5281468  0.06029828  0.78858601  0.3091232
[4,] -0.5573894  0.15506718 -0.60122387  0.5511815
> canlx=zcanx %*% cansvd$u #求生長髮育的潛變量矩陣
> canly=zcany %*% cansvd$v #求身體素質的潛變量矩陣
> cov(canlx,canly) #求生長髮育和身體素質兩個潛變量的協方差矩陣,驗證對角線上元素即爲奇異值。  協方差矩陣的兩種狀況:
(一):設有m個變量xi(i=1,2,...,m),則其協方差矩陣爲每一個變量xi的方差,以及不一樣xi之間的協方差組成的矩陣形式,對角線上爲各自的方差,其他位置協方差。
(二):設有兩組變量xi(i=1,2,...,m)和yj(i=1,2,...,k),兩組變量的協方差矩陣爲對角線上爲xi與yi的協方差(i=j),其他爲(i≠j)的xi與yi的協方差
在進行主成分分,因子分析等以前,都要對原始變量進行中心化,緣由很簡單,由於協方差是離均差積和的平均,用矩陣的形式表示爲,中心化的x的轉置矩陣乘以中心化的x的矩陣再除以n-1。
R中,相應命令爲:第一種狀況cov(x),第二種狀況cov(x,y)            
           [,1]         [,2]          [,3]          [,4]
[1,]  2.385639e+00 4.449148e-16  9.621968e-17  2.924995e-17
[2,] -2.065497e-16 9.572188e-02 -7.068998e-17  5.064008e-17
[3,]  1.538078e-16 5.390705e-17  7.063975e-02 -6.007721e-17
[4,]  2.342269e-16 5.908771e-17 -1.204754e-17  1.184736e-02
> cor(canlx,canly) #求生長髮育和身體素質兩個潛變量的相關矩陣,第一對潛變量的相關係數爲0.8634,
第二對潛變量的相關係數爲0.172,這與教科書上的調整後的典型相關係數類似(0.878和0.167)。這樣能夠
最終選擇第一對潛變量的相關性來反應生長髮育和身體素質的相關性,即相關程度爲0.8634。             
           [,1]         [,2]          [,3]          [,4]
[1,]  8.634332e-01 3.007953e-16  1.103569e-16  2.823501e-17
[2,] -1.991940e-16 1.724381e-01 -2.160334e-16  1.302522e-16
[3,]  1.486870e-16 9.734429e-17  2.163990e-01 -1.548971e-16
[4,]  2.798550e-16 1.318754e-16 -4.561485e-17  3.775345e-02
相關文章
相關標籤/搜索