hadoop之基於某電商離線處理項目架構和實現二(ETL數據清洗)

目錄java 1.需求git 2.詳細設計github 3.使用idea進行MR編程shell 4.本機測試apache 5.服務器測試編程 6.使用hive完成最基本的統計分析vim 1.需求   對CDN的點擊日誌數據清洗bash 2.詳細設計   進行MR編程,對日誌文件數據進行清洗,並將清洗後的數據加載到hive外部表服務器 3.使用idea進行MR編程     這裏不進行詳細的記錄。項目
相關文章
相關標籤/搜索