數據中心化

——by ChanZiyang spa

 

1 什麼是中心化?

在數據處理的過程當中,咱們常常看到"中心化"這個字眼。那麼什麼是中心化呢? code

數據中心化或者去均值(Zero-centered或者Mean-subtraction)。其目的是讓數據經過中心化處理,獲得均值爲0的數據。同時中心化後的數據對向量來講也容易描述,由於是以原點爲基準的。 blog

 

2 中心化公式

數據中心化的數學公式以下: 數學

其中,x表示原始數據,x'表示中心化後的數據,μ表示原始數據的平均值。 io

 

3 樣例

這裏,Data1是二維的原始數據,Average是其平均值,Data2是中心化後的數據。 class

圖中右上角藍色部分表示的是原始數據。左下角紅色部分是中心化後的數據。 grid

因而,咱們能夠看出,數據中心化的過程就是一個將數據平移到原點附近的過程,平移後的中心點就是原點,此時數據在原點周圍分佈。 im

 

4 Matlab代碼 

clear 
data1 = [1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90; 
1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; 
average= mean(data1); %按行取均值 
data2 = bsxfun(@minus, data1,average); %去均值 
figure(1); 
plot(data1(:,1), data1(:,2),'o',data2(:,1), data2(:,2),'o'); %繪製數據分佈圖 
xlabel('x軸');ylabel('y軸'); 
grid on;%顯示網格線 
axis on;%顯示座標軸
相關文章
相關標籤/搜索