三、數據預處理——處理分類型數據：編碼與啞變量

時間 2021-01-07

原文原文鏈接

三、處理分類型特徵：編碼與啞變量點擊標題即可獲取文章相關的源代碼文件喲！在機器學習中，大多數算法，譬如邏輯迴歸，支持向量機SVM，k近鄰算法等都只能夠處理數值型數據，不能處理文字，在sklearn當中，除了專用來處理文字的算法，其他算法在fit的時候全部要求輸入數組或矩陣，也不能夠導入文字型數據（其實手寫決策樹和普斯貝葉斯可以處理文字，但是sklearn中規定必須導入數值型）。然而在現實中，

>>阅读原文<<