補一下前天的進度數據庫
前天主要完成了清洗之後的數據導入hive以及數據的處理(統計前10個)ide
下一階段計劃完成數據可視化展現spa
2.數據處理3d
1.統計最受歡迎的視頻/文章的Top10訪問次數 (video/article)視頻
視頻:blog
文章:ip
2.按照地市統計最受歡迎的Top10課程 (ip)數據可視化
沒有理解這個題什麼意思 可視化
我理解的是分別統計每一個城市最受歡迎的前10個課程 而後我按IP和id進行分組 可是這樣出來的結果不對 不知道咋整im
3.·按照流量統計最受歡迎的Top10課程 (traffic)
3、數據可視化:將統計結果倒入MySql數據庫中,經過圖形化展現的方式展示出來。
將HIVE中的表數據導出到臨時文件中