【sklearn實例】4--特徵工程之離散值編碼

離散特徵 離散特徵變量類型可以分爲有序類和無序類。 無序類,價值相等且可區分,沒有等級、順序、排序、好壞等邏輯關係,各變量相互獨立:性別(男/女)、顏色(赤橙黃綠青藍紫)、登機口(A/B/C); 有序類:各變量有級別大小等邏輯關係:尺碼(L/XL/XXL)、學歷(高/中/低) 爲何要編碼 對無序類:爲何不能直接對特徵進行賦值,比如male1,female0。這是不科學的,因爲這樣一來就存在了大小關
相關文章
相關標籤/搜索