機器學習基礎之新奇和異常值檢測

異常值檢測一般要求新發現的數據是否與現有觀測數據具有相同的分佈或者不同的分佈,相同的分佈可以稱之爲內點(inlier),具有不同分佈的點可以稱之爲離羣值。離羣點和新奇點檢測是不同的,有一個重要的區分必須掌握: 離羣點檢測:訓練數據包含離羣點,這些離羣點被定義爲遠離其它內點的觀察值。因此,離羣點檢測估計器會嘗試擬合出訓練數據中內圍點聚集的區域, 而忽略異常值觀察。 新奇點檢測:訓練數據沒有受到離羣點
相關文章
相關標籤/搜索