大數據隨筆(二)

Hive     Hive是一個構建在Hadoop上的數據倉庫框架,設計目的是讓精通SQL的分析師能夠對存放在HDFS上的大規模數據集執行查詢操作。     Hive把數據組織爲表,通過這種方式爲存儲在HDFS的數據賦予結構,並將表模式等元數據存儲在名爲Merastore的數據庫中。基於這種類似關係的數據模型,Hive把SQL查詢轉換爲一系列在Hadoop集羣上運行的MapReduce作業。  
相關文章
相關標籤/搜索