——by ChanZiyang spa
在數據處理的過程當中,咱們常常看到"中心化"這個字眼。那麼什麼是中心化呢? code
數據中心化或者去均值(Zero-centered或者Mean-subtraction)。其目的是讓數據經過中心化處理,獲得均值爲0的數據。同時中心化後的數據對向量來講也容易描述,由於是以原點爲基準的。 blog
數據中心化的數學公式以下: 數學
其中,x表示原始數據,x'表示中心化後的數據,μ表示原始數據的平均值。 io
這裏,Data1是二維的原始數據,Average是其平均值,Data2是中心化後的數據。 class
圖中右上角藍色部分表示的是原始數據。左下角紅色部分是中心化後的數據。 grid
因而,咱們能夠看出,數據中心化的過程就是一個將數據平移到原點附近的過程,平移後的中心點就是原點,此時數據在原點周圍分佈。 im
clear data1 = [1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90; 1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; average= mean(data1); %按行取均值 data2 = bsxfun(@minus, data1,average); %去均值 figure(1); plot(data1(:,1), data1(:,2),'o',data2(:,1), data2(:,2),'o'); %繪製數據分佈圖 xlabel('x軸');ylabel('y軸'); grid on;%顯示網格線 axis on;%顯示座標軸