數據分析學習——數據清洗

學習這麼長時間的數據分析,卻沒有好好的做個總結,前段時間面試的時候,有面試官提問,如何做數據清洗。但由於平時缺少總結,回答的不是很好。於是博主決定好好地學習總結一番。 數據清洗主要針對一下幾類髒數據:1)缺失值2)異常值3)重複值 缺失值 一、數據爲什麼會缺失 數據缺失主要分爲兩大類: 有意的:有些數據特徵在設計的時候考慮會有缺失值的情況,而缺失數據往往不代表真的缺失,而是另有含義。比如:用戶的子
相關文章
相關標籤/搜索