1、hive用本地文件進行詞頻統計數據庫
1.準備本地txt文件 oop
2.啓動hadoop,啓動hive3d
3.建立數據庫,建立文本表 blog
4.映射本地文件的數據到文本表中hadoop
5.hql語句進行詞頻統計交將結果保存到結果表中。文件上傳
6.查看統計結果im
2、hive用HDFS上的文件進行詞頻統計d3
1.準備電子書或其它大的文本文件統計
2.將文本文件上傳到HDFS上數據
3.建立文本表
4.映射HDFS中的文件數據到文本表中
5.hql語句進行詞頻統計交將結果保存到結果表中
6.查看統計結果
... ...