異常點檢測 孤立森林(isolation forest)

先說重點 1、孤立森林是一種適用於連續數據的無監督異常檢測方法 2、孤立森林,不再是描述正常的樣本點(給出一個正常樣本在特徵空間中的區域,對於不在這個區域中的樣本,視爲異常),而是要孤立異常點。 3、根據‘高密度的簇是需要被切很多次才能被孤立,低密度的點被切分較少次就可以被孤立’的原理,最終算法比較路徑長度的平均值即可捕獲異常點。 4、對小數據集能取得更好的效果。樣本數較多會降低孤立森林孤立異常點
相關文章
相關標籤/搜索