基於歐式距離分類問題的數據標準化處理

機器學習中的分類模型,有一些是基於歐式距離的,如K-means模型。當樣本的特徵較多時, 即便上萬的數據分佈在較高維數空間中,其樣本仍會顯得比較稀疏。 爲了避免使得樣本間的距離過大,須要對數據進行標準化處理。python 而一般scikit-learn中自帶的標準化包是StandardScaler,其是針對每一個特徵的標準化處理,將每維特徵數據轉化爲均指爲0,標準差爲sigma的數據。小程序 可是
相關文章
相關標籤/搜索