三、數據預處理——處理分類型數據:編碼與啞變量

三、處理分類型特徵:編碼與啞變量 點擊標題即可獲取文章相關的源代碼文件喲! 在機器學習中,大多數算法,譬如邏輯迴歸,支持向量機SVM,k近鄰算法等都只能夠處理數值型數據,不能處理文字,在sklearn當中,除了專用來處理文字的算法,其他算法在fit的時候全部要求輸入數組或矩陣,也不能夠導入文字型數據(其實手寫決策樹和普斯貝葉斯可以處理文字,但是sklearn中規定必須導入數值型)。 然而在現實中,
相關文章
相關標籤/搜索