特徵縮放對哪些機器學習算法結果有影響

時間 2019-11-25

標籤特徵縮放哪些機器學習算法結果有影響简体版

原文原文鏈接

在對數據分析建模時，經常須要先進行預處理，特徵縮放是一種消除變量尺度差別的一種方法。如下對最近的學習作一點記錄，指出的算法覆蓋並不全面。算法

舉個例子：根據身高、體重來選擇衣服的尺寸，假如如今有以下3我的的數據：學習

序號	身高	體重	尺寸
1	1.70	68	L
2	1.52	57	S
3	1.75	60	？
問：第三人的衣服應該選擇什麼尺寸？
憑人爲經驗來看應該選擇L比S更合適。
但，若是讓計算機來選擇：
一、1.7 + 68 = 69.7
二、1.52 + 57 = 58.52
三、1.75 + 60 = 61.75
得出的結論是3和2更接近。
因爲體重和身高是兩個不平衡的特徵，因此直接加和或者空間距離等均可能使結果產生較大誤差。