機器學習備忘錄之類別特徵

類別型特徵指在有限選項內取值的特徵。通常爲字符串形式。決策樹等少數模型能直接處理字符串形式的輸入,邏輯迴歸、SVM等類別型特徵必須處理成數值型特徵才能正確工作。 常用方法 序號編碼(Ordinal Encoding) 有大小關係的數據用序號編碼,保留數據之間的大小關係(程度)。 獨熱編碼(One-hot Encoding) one-hot編碼,類別間不具有大小關係的特徵,生成的是多維稀疏向量,可使
相關文章
相關標籤/搜索