精通特徵工程筆記(二)

分類變量的處理   編碼方式:   >> one-hot編碼   >> 虛擬編碼:one-hot編碼對於k類別的變量編輯一個長度爲k的特徵向量,實際上自由變量只有k-1個。虛擬編碼對於k類別的變量編輯一個長度爲k-1的特徵向量,使得編碼更具有解釋性   >> 效果編碼:與虛擬編碼類似,區別在於參照類由全部由-1的向量表示,示例如下所示:           存在的問題:   one-hot編碼有冗
相關文章
相關標籤/搜索