機器學習--變量編碼方式

在機器學習問題中,我們通過訓練數據集學習得到的其實就是一組模型的參數,然後通過學習得到的參數確定模型的表示,最後用這個模型再去進行我們後續的預測分類等工作。在模型訓練過程中,我們會對訓練數據集進行抽象、抽取大量特徵,這些特徵中有離散型特徵也有連續型特徵。若此時你使用的模型是簡單模型(如LR),那麼通常我們會對連續型特徵進行離散化操作,然後再對離散的特徵,進行one-hot編碼或啞變量編碼。這樣的操
相關文章
相關標籤/搜索