使用 MapReduce 處理用電數據

1,數據清洗:將不規整數據轉化爲規整數據         剛剛採集到HDFS中的原生數據,咱們也稱爲不規整數據,即目前來講,該數據的格式還沒法知足咱們對數據處理的基本要求,須要對其進行預處理,轉化爲咱們後面工做所須要的較爲規整的數據,因此這裏的數據清洗,其實指的就是對數據進行基本的預處理,以方便咱們後面的統計分析,因此這一步並非必須的,須要根據不一樣的業務需求來進行取捨,只是在咱們的場景中須要對數
相關文章
相關標籤/搜索