使用gbdt時類別特徵的處理方法

在去年第一次參加ctr比賽中碰到類別特徵時,第一反應是進行one-hot編碼而不能使用序號編碼,因爲序號編碼給類別的不同屬性賦予了數值的意義,然而在實際比賽中發現,one-hot編碼後的效果並不好,甚至和直接序號編碼的效果不相上下,但是帶來訓練時間的增加非常大,那麼爲什麼對類別進行one-hot編碼和label編碼效果差不多,而不是更好呢?在參加比賽之後我對這些有了更多的見解,在此總結。 其實對類
相關文章
相關標籤/搜索