機器學習總結----iForest異常值處理

本篇博客參考了 iForest 主要思想 iForest適用於連續數據的異常檢測,它將一場定義爲「容易被孤立的離羣點」,也可以理解爲分佈稀疏且離密度高的羣體較遠的點,屬於一種無參數無監督的方法。 在iforest中,我們不斷的用超平面切割空間,知道每個子空間只剩下一個點,那麼我們就可以看出,密度高的簇要被切很多次才能將裏面的點單獨分割出來,而密度低的點,很容易就會被超平面分割到一個單獨的空間裏。
相關文章
相關標籤/搜索