箱體模型數據分析

數據質量分析,是數據挖掘中數據準備過程中的重要一環,是數據預處理的前提,也是數據挖掘分析結論有效性和準確性的基礎。 其主要任務是檢測原始數據中是否存在髒數據,髒數據一般包括:缺失值、異常值、不一致值、重複數據及含有特殊符號的數據。 其中異常值分析時對樣本中個別值的提取,也成爲離羣點分析。 可以採用(1)簡單統計量分析(2)3б原則(正態分佈)(3)箱型圖分析 下圖爲對一組數據進行異常分析之前所做的
相關文章
相關標籤/搜索