Hadoop綜合大作業

1.用Hive對爬蟲大作業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)進行詞頻統計。 先下載英語長篇文章到wc文件下 上傳5000-8文件到hdfs 進入hive,創建新表   在hdfs中的5000-8.txt導入到english表中   查看該表中的信息   進行詞頻統計存放在english_count表中   查看english_count表的前20行數據     2.用Hive對爬
相關文章
相關標籤/搜索