Hadoop綜合大作業

1.用Hive對爬蟲大作業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)進行詞頻統計。 啓動hadoop   Hdfs上創建文件夾 data 爲名字 上傳文件至hdfs 啓動Hive 創建原始文檔表 導入文件內容到表docs並查看 導入   查看    用HQL進行詞頻統計,結果放在表word_count裏 查看統計結果 結果有3萬多行 所以只截圖其中幾行來當例子       2.用Hive
相關文章
相關標籤/搜索