Hadoop綜合大做業

Hadoop綜合大做業 要求:oop

1.用Hive對爬蟲大做業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)詞頻統計。3d

我下載了一篇英文小說來進行詞頻統計分析。excel

首先啓動hadoopblog

文件上傳到hdfshadoop

 

啓動hive博客

建立小說表,並導入數據數據分析

用HQL進行詞頻統計,結果放在表word_count裏文件上傳

查看統計結果csv

2.用Hive對爬蟲大做業產生的csv文件進行數據分析,寫一篇博客描述你的分析過程和分析結果。下載

用excel放入hive的sh文件

正常輸出的查看信息

相關文章
相關標籤/搜索