【網站點擊流數據分析】04-數據預處理

1、主要目的 過濾「不合規」數據 格式轉換和規整 根據後續的統計需求,過濾分離出各種不同主題(不同欄目path)的基礎數據 2、實現方式 開發一個mr程序WeblogPreProcess。 package com.learn.bigdata.hive.mr.pre; import java.io.IOException; import java.util.HashSet; import java
相關文章
相關標籤/搜索