《Outlier Analysis 2nd Edition》- 1.2 The Data Model is Everything

幾乎所有異常值檢測算法都會建立數據中正常模式的模型,然後根據這些模式的偏差計算給定數據點的異常值。 例如,該數據模型可以是生成模型,例如高斯混合模型,基於迴歸的模型或基於鄰近的模型。 所有這些模型對數據的「正常」行爲做出不同的假設。 然後通過評估數據點與模型之間的擬合質量來計算數據點的離羣值分數。 在很多情況下,模型可能是算法定義的。 例如,基於最近鄰的離羣值檢測算法根據其最近鄰距離的分佈對數據點
相關文章
相關標籤/搜索