【異常檢測】孤立森林(Isolation Forest)算法簡介

簡介     工作的過程中經常會遇到這樣一個問題,在構建模型訓練數據時,我們很難保證訓練數據的純淨度,數據中往往會參雜很多被錯誤標記的髒數據,而數據的質量決定了最終模型性能的好壞。如果進行人工二次標記,成本會很高,我們希望能使用一種無監督算法幫我們做這件事,異常檢測算法可以在一定程度上解決這個問題。   異常檢測分爲離羣點檢測(outlier detection)以及奇異值檢測(novelty d
相關文章
相關標籤/搜索