孤立森林(Isolation Forest)

背景 現有的異常檢測方法主要是通過對正常樣本的描述,給出一個正常樣本在特徵空間中的區域,對於不在這個區域中的樣本,視爲異常。這些方法的主要缺點是,異常檢測器只會對正常樣本的描述做優化,而不會對異常樣本的描述做優化,這樣就有可能造成大量的誤報,或者只檢測到少量的異常。 異常的兩個特點:異常數據只佔很少量、異常數據特徵值和正常數據差別很大。 孤立森林,不再是描述正常的樣本點,而是要孤立異常點,由周志華
相關文章
相關標籤/搜索