HADOOP綜合大作業

1.用Hive對爬蟲大作業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)進行詞頻統計。    (1)開啓所有的服務,並創建文件夾wwc (2)查看目錄下所有文件   (3)把hdfs文件系統中文件夾裏的文本文件load進去。   (4)進入hive,並查看所有的表   (5)創建表word,,寫hiveQL命令統計   (6)運行結果   2.用Hive對爬蟲大作業產生的csv文件進行數據分
相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息