大數據開發面試:impala和hive的比較

Impala: Cloudera公司推出,提供對於hdfs,hbase數據的高性能,低延遲的交互式sql 查詢功能 基於hive,使用內存計算,兼顧數據倉庫,具有實時,批處理,多併發等優點 是CDH首選的PB級大數據實時查詢,分析引擎。 內存計算比I/O計算要快,內存計算不依賴於磁盤,受制於內存大小,對於磁盤的要求更高。 Hive是基於MapReduce,內存可以很小。 Map階段是一條一條的處理
相關文章
相關標籤/搜索