Python scikit-learn,數據的預處理,歸一化,MinMaxScaler

數據的預處理:通過特定的統計方法(數學方法)將數據轉換成算法要求的數據 數值型數據:標準縮放:歸一化、標準化、缺失值處理 類別型數據(字典類型):one-hot編碼 時間類型:時間的切分(重採樣)   爲什麼要歸一化? 歸一化之後可以平衡各個特徵的重要性。(例如在計算不同樣本之間的距離時,歸一化後可以避免某一個特徵的重要性過大或過小)  歸一化的缺點:歸一化受異常點(最大值,最小值)的影響較大。
相關文章
相關標籤/搜索