主成分分析——數據中心化與標準化處理

在主成分分析法中,一般來說,我們進行的第一步應該是對所有樣本數據進行中心化,甚至是標準化處理。那麼我們爲什麼要對樣本數據進行中心化和標準化處理呢? 在一般的實際問題當中,我們要分析的數據一般是多個維度的,由多個特徵或者屬性構成的複雜數據集合。例如對某個地區的人均收入構建預測模型或者進行分析的時候,我們會考慮到該地區的GDP總量、人口數量、稅收等,顯然它們的單位或者說是數量級都是不一樣的。我們通過中
相關文章
相關標籤/搜索