Hadoop學習系列筆記(六):關於Hive

Hive是構建在Hadoop上的數據倉庫框架。Hive設計的目的是讓精通SQL技能(但Java編程技能相對較弱)的分析師能夠對Facebook存放在HDFS中的大規模數據集執行查詢,是一個通用的、可伸縮的數據處理平臺。 Hive一般在工作站上運行,它把SQL查詢轉換爲一系列在Hadoop集羣上運行的MapReduce作業。Hive把數據組織爲表,元數據(如表模式)存儲在metastore數據庫中。
相關文章
相關標籤/搜索