Hive 操做與應用 詞頻統計

1、hive用本地文件進行詞頻統計數據庫

1.準備本地txt文件 oop

 

 

 

2.啓動hadoop,啓動hive3d

 

 

 

3.建立數據庫,建立文本表 blog

 

 

 

4.映射本地文件的數據到文本表中hadoop

                               

 

 

 

5.hql語句進行詞頻統計交將結果保存到結果表中。文件上傳

 

 

 

 

 

6.查看統計結果im

 

 

2、hive用HDFS上的文件進行詞頻統計d3

1.準備電子書或其它大的文本文件統計

 

 

2.將文本文件上傳到HDFS上數據

 

 

3.建立文本表

 

 

4.映射HDFS中的文件數據到文本表中

 

 

5.hql語句進行詞頻統計交將結果保存到結果表中

 

 

 

 

6.查看統計結果

 

 ... ...

相關文章
相關標籤/搜索