數據科學中的陷阱:定性變量的處理

定性變量,也就是表示類別的變量,好比性別、省份等。對於這類變量,不能在模型裏直接使用它們,由於定性變量之間的數學計算是毫無心義的。另外一方面,定性變量是一類很常見的變量,一般帶着頗有價值的信息。所以,這篇文章就將討論如何正確地在模型裏使用定性變量。 對於定性變量,常見的處理方法有兩種:一種是將定性變量轉換爲多個虛擬變量,另外一種對將有序的定性變量轉換爲定量變量。ide 1、虛擬變量學習 正如前文中
相關文章
相關標籤/搜索