Encoding編碼

編碼 編碼或者連續化處理是把分類變量轉火車數值副本的過程。譬如,處理性別時,男的定爲1,女的定爲0.分類變量在許多模型方法中(譬如,線性迴歸,SVM,神經網絡)必須進行編碼。兩種主要的編碼類型是二進制編碼和基於目標的編碼。 二進制編碼(Binary Encoding) 通過用0或者1來表示每個類別不存在或者存在是分類變量量化的一個方法。如果分類變量有k個分類,那麼我們需要創建k個二進制變量(理論上
相關文章
相關標籤/搜索