數據預處理中常見的啞編碼/獨熱編碼(One-Hot Encoding)詳解(一看就懂)

通常需要處理的數值都是稀疏而又散亂地分佈在空間中,然而,我們並不需要存儲這些大數值,這時可以用獨熱編碼。 例如:我們需要處理4維向量空間,當給一個特徵向量的第n個特徵進行編碼時,編碼器會遍歷每個特徵向量的第n個特徵,然後進行非重複計數。若第n個特徵的最大值爲K,則就把這個特徵轉換爲只有一個值爲1而其他值都是0的K+1維向量。 encoder=OneHotEncoder(sparse=False) 
相關文章
相關標籤/搜索