特徵工程:缺失值處理

缺失值包含的不止是字面意思那樣爲空的值,比如-999,-1或其他特殊字符也可能代表缺失值 隱藏的缺失值 當遇到特殊數字-1之類的情況時,我們如何確定它代表的是缺失值呢?我們可以畫出特徵的分佈圖,如果-1遠離大部分值的分佈範圍,那極有可能-1代表的就是缺失值 缺失值填充 1.-999,-1等 相當於把缺失的情況當做一種特殊類別來處理,對linear model,神經網絡性能有影響 2.均值,中位數等
相關文章
相關標籤/搜索