數據清理,項目成功的祕訣所在

全文共2134字,預計學習時長6分鐘 圖源:towardsdatascience   數據清理佔到數據科學家工作時間的很大一部分,原始數據必須經過處理才能使用,因而數據準備是數據科學中最重要也是首要的部分,它包括數據預處理和數據整理。   原始數據的來源紛雜,不適合直接進行分析。例如,重複的條目,或者可能在記錄客戶的電子郵件id時出現了打字錯誤,或者有一些調查員遺留下來的問題。對於未清理的數據集,
相關文章
相關標籤/搜索