數據預處理的幾個名詞:中心化,歸一化,去相關,白化

中心化 對數據中的每個獨立值都減去一個值,使其數據各維度的中心都移到零點 歸一化 將所有數據的範圍都變爲一個區間,使其數值範圍都幾乎相等。例如把所有數據都映射到-1~1之間。 去相關 把特徵之間的相關性降低,數據的協方差矩陣變成對角陣,且中心爲0 白化 對去相關後的數據將其方差映射到一個差不多大小的範圍,如果本身數據分佈是一個多變量的高斯分佈,那麼白化後的數據是一個均值爲0,且協方差相等的矩陣。
相關文章
相關標籤/搜索