數據預處理——缺失值和異常值的識別和填補

1、什麼是異常值?什麼是缺失值html 異常值(outlier):異常值是指數據集中存在不合理的值,又稱離羣點。一組測定值中與平均值的誤差超過兩倍標準差的測定值,與平均值的誤差超過三倍標準差的測定值,稱爲高度異常的異常值。【百度百科】python 缺失值(missing value):是指粗糙數據中因爲缺乏信息而形成的數據的聚類、分組、刪失或截斷。它指的是現有數據集中某個或某些屬性的值是不徹底的。
相關文章
相關標籤/搜索