Hive學習總結之五:HBase和Hive的集成

Hive和Hbase有各自不一樣的特徵:hive是高延遲、結構化和麪向分析的,hbase是低延遲、非結構化和麪向編程的。Hive數據倉庫在hadoop上是高延遲的。Hive集成Hbase就是爲了使用hbase的一些特性。以下是hive和hbase的集成架構: 數據庫

2

 

圖1 hive和hbase架構圖 編程

        Hive集成HBase能夠有效利用HBase數據庫的存儲特性,如行更新和列索引等。在集成的過程當中注意維持HBase jar包的一致性。Hive集成HBase須要在Hive表和HBase表之間創建映射關係,也就是Hive表的列(columns)和列類型(column types)與HBase表的列族(column families)及列限定詞(column qualifiers)創建關聯。每個在Hive表中的域都存在於HBase中,而在Hive表中不須要包含全部HBase中的列。HBase中的RowKey對應到Hive中爲選擇一個域使用:key來對應,列族(cf:)映射到Hive中的其它全部域,列爲(cf:cq)。例以下圖2爲Hive表映射到HBase表: bash

1

圖2 Hive表映射HBase表 架構

相關文章
相關標籤/搜索