數據預處理與特徵工程

數據預處理與特徵工程 缺失值處理 缺失值處理通常有如下的方法: 對於unknown值數量較少的變量,包括job和marital,刪除這些變量是缺失值(unknown)的行; 如果預計該變量對於學習模型效果影響不大,可以對unknown值賦衆數,這裏認爲變量都對學習模型有較大影響,不採取此法; 可以使用數據完整的行作爲訓練集,以此來預測缺失值,變量housing,loan,education和def
相關文章
相關標籤/搜索