Hadoop綜合大做業 要求:oop
1.用Hive對爬蟲大做業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)詞頻統計。3d
我下載了一篇英文小說來進行詞頻統計分析。excel
首先啓動hadoopblog
文件上傳到hdfshadoop
啓動hive博客
建立小說表,並導入數據數據分析
用HQL進行詞頻統計,結果放在表word_count裏文件上傳
查看統計結果csv
2.用Hive對爬蟲大做業產生的csv文件進行數據分析,寫一篇博客描述你的分析過程和分析結果。下載
用excel放入hive的sh文件
正常輸出的查看信息