SequoiaDB 與 Hive 集成

時間 2019-11-10

標籤 sequoiadb hive 集成欄目 Hadoop 简体版

原文原文鏈接

SequoiaDB與Hadoop部署

SequoiaDB與Hadoop在物理上部署方案以下圖所示，部署建議以下： java

l SequoiaDB與Hadoop部署在相同的物理設備上，以減小Hadoop與SequoiaDB之間的網絡數據傳輸； shell

l 每一個物理設備上都部署一個協調節點和多個數據節點，編目節點可選在任意三臺物理設備各部署一個編目節點；網絡

SequoiaDB支持的Hive 版本列表

n Hive 0.11.0 app

n Hive 0.10.0 jsp

配置方法

安裝和配置好Hadoop/Hive 環境，啓動hadoop環境；
拷貝sequoiadb安裝目錄下(默認在/opt/sequoiadb) 的hadoop/hive-sequoiadb.jar 和 java/sdbdriver.jar 兩個文件拷貝到 hive/lib 安裝目錄下;
修改hive 安裝目錄下的 bin/hive-site.xml文件(若是不存在，可拷貝$HIVE_HOME/conf/hive-default.xml.template爲 hive-site.xml文件 ),增長以下屬性(假設Hive 安裝在 /opt/hive 目錄):

<property> oop

<name>hive.aux.jars.path</name> <value>file:///opt/hive/lib/hive-sequoiadb.jar,file:///opt/hive/lib/sdbdirver.jar</value> spa

<description>Sequoiadb store handler jar file</description> 命令行

</property> orm

<property> xml

<name> hive.auto.convert.join</name>

<value>false</value>

</property>

使用方法

建立基於SequoiaDB的表:

啓動hive shell 命令行窗口，執行以下命令建立數據表；

hive> create external table sdb_tab(id INT, name STRING, value DOUBLE) stored by 「com.sequoiadb.hive.SdbHiveStorageHandler」 tblproperties(「sdb.address」 = 「localhost:50000」;)

Time taken: 0.386 seconds

其中：

Sdb.address 用於指定SequoiaDB協調節點的IP和端口，若是有多個協調節點，能夠寫入多個，之間用逗號隔開；