Hadoop綜合大做業

1.用Hive對爬蟲大做業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)進行詞頻統計。數據庫

  • 啓動hadoop:
  • 上傳到wc文件中
  • 啓動Hive
  • 在hive數據庫建立表 world:
  • 導入文本test.txt並查看
  • 用HQL進行詞頻統計

2.用Hive對爬蟲大做業產生的csv文件進行數據分析,寫一篇博客描述你的分析過程和分析結果。oop

  • 建立用於存放csv數據目錄
  • 把文件放入文件夾中
  • 查看文件中的數據:
  • 導入數據庫表中
相關文章
相關標籤/搜索