異常檢測的統計學方法

通常可以使用兩種指標:Z分數 和 四分位距(IQR)。 計算一個樣本的 z 分數,就是減去均值再除以標準差,如果絕對值大於三倍標準差,就認爲這個樣本異常,屬於離羣點。 對於正態分佈的數據,用 Z 分數爲指標,有千分之三的離羣點。 用 IQR 爲指標,判定的方式爲:在四分位點上加上1.5倍IQR,這個範圍之外的都是離羣點,正態分佈有千分之七的離羣點。 IQR 常用來畫箱線圖,所以箱線圖也可以用來直觀
相關文章
相關標籤/搜索