大數據原理分析

大數據原理分析 第一是大數據的數據獲取方式:html 數據清洗是將重複,多餘的數據篩選清除,將缺失的數據補全完整,將錯誤的數據糾正或者刪除;最後整理成咱們能夠進一步使用和加工的數據保存到數據庫中。數據庫 所謂的數據清洗也就是ETL處理,包括抽取Extract,轉換TRANSFORM,加載LOAD這三大法寶。post 數據清洗的步驟通常都包括:分析數據,缺失值處理,異常值處理,去重處理,噪音數據處理
相關文章
相關標籤/搜索