數據預處理:獨熱編碼(One-Hot Encoding)和 LabelEncoder標籤編碼

一、問題由來 在很多機器學習任務中,特徵並不總是連續值,而有可能是分類值。 離散特徵的編碼分爲兩種情況:   1、離散特徵的取值之間沒有大小的意義,比如color:[red,blue],那麼就使用one-hot編碼   2、離散特徵的取值有大小的意義,比如size:[X,XL,XXL],那麼就使用數值的映射{X:1,XL:2,XXL:3} 使用pandas可以很方便的對離散型特徵進行one-hot
相關文章
相關標籤/搜索