Python對離散變量處理:啞變量編碼和one-hot編碼

在數據進行建模分析,沒法直接把類別變量放入模型中去分析,所以,須要對類別變量進行處理。最多見的方法是對類別變量作啞變量編碼或one-hot編碼,因此運用最近的業務數據進行了嘗試。啞變量編碼和one-hot編碼的具體介紹和區別在ML小菜鳥的博客中有比較詳細的介紹博客連接。html 作啞變量編碼的庫:pandas one-hot編碼的庫:sklearn、keras 注意:pandas默認只處理字符串類
相關文章
相關標籤/搜索