淺談數據挖掘中的數據處理(缺失值處理以及異常值檢測)

一直想把數據預處理的邏輯給理清楚點,在這裏和你們一塊兒分享。html 一:缺失值的處理 刪除缺失值 這是一種很經常使用的策略。算法 缺點:若是缺失值太多,最終刪除到沒有什麼數據了。那就很差辦了。數據庫 2.2 缺失值的填補網絡     (1)均值法函數         根據缺失值的屬性相關係數最大的那個屬性把數據分紅幾個組,而後分別計算每一個組的均值,把這些均值放入到缺失的數值裏面就能夠了。pos
相關文章
相關標籤/搜索