大數據項目——互聯網精準營銷——數據清洗

使用kettle進行數據清洗:html  1.新建轉換去除手機銷售信息表的重複記錄   要求:去除該字段中的全部空格,方便後續聚合統計,字母統一大小寫,去除該字段中的全部特殊字符(各類標點符號) 正則表達式       這裏可選用排序加去重組件,也可用哈希去重。而後用字符串操做去括號,大小寫統一。字符串替換的正則表達式去除特殊字符。post            2.新建轉換去除用戶評論信息表的重
相關文章
相關標籤/搜索