數據清洗中異常值如何處理(下)

數據清洗工作中面對的對象有三個——異常值,缺失值和重複值。而每個骯髒數據都是有各自的清洗方法,尤其是異常值的方法是最多的。由此可見,數據中的異常值是有很多的,在上一篇文章中我們給大家介紹了關於清洗異常值的一些方法,在這篇文章中我們會繼續爲大家介紹異常值的清洗。 第一我們給大家介紹的是基於模型檢測,具體操作就是先建立一個數據模型,異常是那些同模型不能完美擬合的對象;如果模型是簇的集合,則異常是不顯著
相關文章
相關標籤/搜索