數據預處理--數據檢查、變量標準化、分佈變換、構造特徵、特徵篩選

1、數據檢查html 1)缺失值算法 有時候是null,有時候全是0,這個須要比想象中更仔細,由於取數的同窗們有時候會默認填充0,有時候是由於數據庫遷移,產品剛剛發佈因此太遠的數據沒有等緣由形成的,這些須要及時確認數據庫 對於有些變量僅對特定的人有值,(好比說理財的產品偏好,固然只有買了理財的人才會有偏好數據能夠分析),能夠給沒有這個值的人填充一個數值,能夠是999這樣這個字段不會取到的大值(可是
相關文章
相關標籤/搜索