數據預處理與特徵工程

注意啞變量的問題 #將文本型數據轉化爲數值型數據 以適應只能處理數字型數據的算法 但是不能直接轉化 要考慮是名義變量、有序變量還是有距變量 分類轉換成數字的時候,不能忽略了數字中自帶的數學性質,所 以給算法傳達了一些不準確的信息,而這會影響我們的建模。 類別OrdinalEncoder可以用來處理有序變量,但對於名義變量,我們只有使用啞變量的方式來處理,才能夠儘量 向算法傳達最準確的信息: 此時要
相關文章
相關標籤/搜索