異常點/離羣點檢測算法——LOF

  在數據挖掘方面,經常需要在做特徵工程和模型訓練之前對數據進行清洗,剔除無效數據和異常數據。異常檢測也是數據挖掘的一個方向,用於反作弊、僞基站、金融詐騙等領域。   異常檢測方法,針對不同的數據形式,有不同的實現方法。常用的有基於分佈的方法,在上、下α分位點之外的值認爲是異常值(例如圖1),對於屬性值常用此類方法。基於距離的方法,適用於二維或高維座標體系內異常點的判別,例如二維平面座標或經緯度空
相關文章
相關標籤/搜索