大數據預處理技術

學習了牛琨老師的課程後整理的學習筆記,用於日後複習 一、大數據預處理的幾個步驟 1.數據預處理 2.數據清洗 3.數據集成 4.數據歸約 5.數據變換  6.數據離散化 7.大數據預處理 二、數據預處理 現實中的數據大多是「髒」數據: ①不完整 缺少屬性值或僅僅包含聚集數據 ②含噪聲 包含錯誤或存在偏離期望的離羣值 比如:salary=「-10」,明顯是錯誤數據 ③不一致 用於商品分類的部門編碼存
相關文章
相關標籤/搜索