什麼是獨熱編碼,它的坑你踩過嗎?

爲何要用獨熱編碼函數 爲何要用獨熱編碼,這是特徵工程中的問題,若是是類別型的特徵,比較粗的方法就是將文本特徵進行數值化,好比'A'->1,'B'->2。測試 可是,做爲類別型特徵,單純的將其數值化會讓模型賦予了數值大小含義,而實際上數字大或小並無區別。編碼   因此針對類別型特徵,用one-hot獨熱編碼進行處理。如:特徵A,有三個類別a,b,c。通過獨熱編碼,將會生成3個特徵:A_a,A_b,A
相關文章
相關標籤/搜索