數據預處理-處理分類型特徵:編碼(LabelEncoder、OrdinalEncoder)

前言: 在機器學習中,大多數算法,譬如邏輯迴歸,支持向量機SVM,k近鄰算法等都只可以處理數值型數據,不能處理文字,在sklearn當中,除了專用來處理文字的算法,其餘算法在fit的時候所有要求輸入數組或矩陣,也不可以導入文字型數據(其實手寫決策樹和普斯貝葉斯能夠處理文字,可是sklearn中規定必須導入數值型)。 然而在現實中,許多標籤和特徵在數據收集完畢的時候,都不是以數字來表現的。好比說,學
相關文章
相關標籤/搜索