數據預處理之獨熱編碼

一、問題由來 在很多機器學習任務中,特徵並不總是連續值,而有可能是分類值。 離散特徵的編碼分爲兩種情況: 1、離散特徵的取值之間沒有大小的意義,比如color:[red,blue],那麼就使用one-hot編碼 2、離散特徵的取值有大小的意義,比如size:[X,XL,XXL],那麼就使用數值的映射{X:1,XL:2,XXL:3} 使用pandas可以很方便的對離散型特徵進行one-hot編碼 復
相關文章
相關標籤/搜索