機器學習小組- 特徵工程1

歸一化 把所有的數據都映射到同一個尺度(量綱)上。 最值歸一化(normalization): 把所有數據映射到0-1之間。最值歸一化的使用範圍是特徵的分佈具有明顯邊界的(分數0~100分、灰度0~255),受outlier的影響比較大。 均值方差歸一化(standardization): 把所有數據歸一到均值爲0方差爲1的分佈中。適用於數據中沒有明顯的邊界,有可能存在極端數據值的情況。 特徵工程
相關文章
相關標籤/搜索