缺失數據處理

缺失數據意味着我們的數據集可能是不完整的,之前的例子中 德國的缺了薪水,西班牙的缺了年齡。對於缺失的數據最簡單的處理方法就是刪除這兩行數據,但是這樣的話可能會遺失重要的信息,所以要採取一個更好的方法,最常用的方法就是,取這一列的平均值,或者是最常見的值來對缺失的數據進行補充。 我們用工具來完成這個過程 from sklearn.preprocessing import Imputer sklear
相關文章
相關標籤/搜索