數據預處理---缺失值

數據預處理---缺失值


在日常的數據處理中不可避免的是數據集中的一些數據缺失某個或某些維度,這也造成了未處理的數據因其中含有NAN值而無法使用,這裏介紹一種缺失值的處理

將?替換爲標準缺失值表示
data=data.replace(to_replace='?'),value=np.nan

丟棄帶有缺失值的數據(只要有一個維度有缺失)

data=data.dropna(how='any')

輸出data的數據量和維度

data.shape

以上僅爲個人學習筆記記錄,如有錯誤,敬請指正本人在jupyter上測試的乳腺癌腫瘤的代碼