python用箱型圖進行異常值檢測

異常值檢測:數據挖掘工做中的第一步就是異常值檢測,異常值的存在會影響實驗結果。異常值是指樣本中的個別值,也稱爲離羣點,其數值明顯偏離其他的觀測值。經常使用檢測方法3 σ 原則和箱型圖。其中,3 σ 原則只適用服從正態分佈的數據。在3 σ 原則下,異常值被定義爲觀察值和平均值的誤差超過3倍標準差的值。 P(|x−μ|>3σ)≤0.003 ,在正太分佈假設下,大於3 σ 的值出現的機率小於0.003,
相關文章
相關標籤/搜索