數據科學中的陷阱:定性變量的處理

定性變量,也就是表示類別的變量,比如性別、省份等。對於這類變量,不能在模型裏直接使用它們,因爲定性變量之間的數學計算是毫無意義的。另一方面,定性變量是一類很常見的變量,通常帶着很有價值的信息。因此,這篇文章就將討論如何正確地在模型裏使用定性變量。 對於定性變量,常見的處理方法有兩種:一種是將定性變量轉換爲多個虛擬變量,另一種對將有序的定性變量轉換爲定量變量。 一、虛擬變量 正如前文中討論的,直接對
相關文章
相關標籤/搜索