餘老師帶你學習大數據-Spark快速大數據處理第五章第一節​Hive總體介紹

Hive是什麼 Hive是大數據倉庫的基本組件。右側是用java寫的MapReduce的Wordcount例子,使用SQL語句去實現數據的查詢、數據的分析。左側是SQL語句實現Wordcount,首先將每一行切開根據每一個單詞Space,從file中hdfs文件,然後根據Word進行排列,這都是map形式,最後再計算每個Word的總量,根據Word進行Order。下方是將上方的語句分解爲兩個部分,
相關文章
相關標籤/搜索