hue(04)、Hue集成Hive數據倉庫

        在 hue(02)、Hue集成Hadoop集羣(HDFS和YARN) 中咱們在hue中集成了hdfs和yarn,能夠很方便的在hue中操做hdfs中的數據和查看MapReduce的做業執行狀況。本文咱們將在hue中集成hive數據倉庫,用替代hive本身的hwi服務,能夠很方便的在hue中進行hive的sql查詢等操做。mysql

1、環境準備

1.hadoop集羣服務sql

2.hive-mysql元數據庫服務數據庫

3.hive服務api

4.hue4.1session

2、集成配置

打開hue的/desktop/conf/目錄下的 pseudo-distributed.ini文件        oracle

編輯pseudo-distributed.ini文件 ,找到[beeswax]這一節,修改信息鏈接爲hdpc01的機器上的Hive數據倉庫服務,修改信息以下:工具

hive_server_host=hdpc01oop

hive_server_port=10000spa

server_conn_timeout=120.net

list_partitions_limit=10000

query_partitions_limit=10

download_row_limit=100000

max_number_of_sessions=10

3、集成準備

1.啓動hadoop集羣

啓動hadoop三臺機器,而後在主節點機器上啓動hadoop集羣:start-all.sh

2.啓動Hiveserver服務

在hive機器上啓動hiveserver服務:hive --service hiveserver2 或者hive --service hiveserver2 &

3.啓動Hive Metastore服務

在hive機器上啓動Hive Metastore服務:hive --service metastore或者hive --service metastore &      

看到以下信息,說明啓動完成:

4.啓動Hue服務

在hue的/bulid/env/bin/目錄下執行./supervisor 命令啓動hue服務

5.驗證啓動

在終端輸入jps -ml查看:

能夠看到hadoop集羣個hive服務啓動都正常

4、集成驗證及簡單使用

登錄Hue服務,點擊hive能夠看到hive的默認default的庫,和咱們以前使用hive時建的表

查看hive表的詳細信息,右擊表點擊Open in Browser在右邊的Table Browser視圖中,能夠看到表的結構及字段自定義、部分數據等

點擊columns標籤能夠看到表字段的詳細信息

點擊sample標籤能夠看到該表所有的數據信息

使用hue中的hive查詢器查詢hive表中的數據

在hue中還有更多能夠操做hive的方式,你們能夠本身嘗試別的,本文先這麼多基本的操做

5、問題總結

1.hue提示Could not start SASL: Error in sasl_client_start (-4) SASL(-4)的異常

問題緣由:由於系統缺乏了相關的依賴

解決辦法:咱們在hue所在主機安裝如下的依賴

yum install cyrus-sasl-plain cyrus-sasl-devel cyrus-sasl-gssapi

六、文末總結

        文本的使用hue鏈接操做hive數據倉庫比較以前hive本身的hwi功能更強大,同時hue支持更多的應用,集成在一塊兒更像是一個操做、監控爲一體的平臺化的工具,在後面的文章咱們還繼續去使用hue集成HBase、mysql、oracle等

相關文章
相關標籤/搜索