數據標準化處理

Z-score 標準化 適用範圍 1.數據的最大值和最小值未知 2.有超出取值範圍的離羣數據 經過處理的數據符合標準正態分佈,即均值爲0,標準差爲1,其轉化函數爲: x∗=(x−μ)/σ 標準化後的變量值圍繞0上下波動,大於0說明高於平均水平,小於0說明低於平均水平。 缺點 估算Z-Score需要總體的平均值與方差,但是很難得到,大多數情況下是用樣本的均值與標準差替代。 對於數據的分佈有一定的要求
相關文章
相關標籤/搜索