數據清洗

因爲以前用jdbc鏈接hive鏈接失敗,此次改用直接用HQL語句來完成任務,以前的鏈接失敗還未解決mysql

以前第一階段已經將文檔清洗完畢,包括轉化日期格式,去掉逗號等操做sql

現經過HQL命令完成題目:數據庫

2、數據處理:ide

·統計最受歡迎的視頻/文章的Top10訪問次數 (video/articlespa

 

 

 

 

 

 

 

 

 

 

 

·按照地市統計最受歡迎的Top10課程 (ip3d

 

 

 

 

 

 

·按照流量統計最受歡迎的Top10課程 (traffic視頻

 

 

 

 

 

 

 

一、 數據可視化:將統計結果倒入MySql數據庫中,經過圖形化展現的方式展示出來。blog

這一步先將HIVE中的表數據導出到本地文件中,ip

 

 而後經過命令將數據導入到MYSQL文檔

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 最後經過mysql的JDBC鏈接實現數據的查詢可視化顯示出來。

 

 

 

 

 

 

 

相關文章
相關標籤/搜索