數據預處理中常見的啞編碼/獨熱編碼(One-Hot Encoding)詳解(一看就懂)

一般須要處理的數值都是稀疏而又散亂地分佈在空間中,然而,咱們並不須要存儲這些大數值,這時能夠用獨熱編碼。數組 例如:咱們須要處理4維向量空間,當給一個特徵向量的第n個特徵進行編碼時,編碼器會遍歷每一個特徵向量的第n個特徵,而後進行非重複計數。若第n個特徵的最大值爲K,則就把這個特徵轉換爲只有一個值爲1而其餘值都是0的K+1維向量。機器學習 encoder=OneHotEncoder(sparse=
相關文章
相關標籤/搜索