hue(04)、Hue集成Hive數據倉庫

時間 2019-11-06

標籤 hue 集成 hive 數據倉庫欄目 Hadoop 简体版

原文原文鏈接

在 hue(02)、Hue集成Hadoop集羣(HDFS和YARN) 中咱們在hue中集成了hdfs和yarn，能夠很方便的在hue中操做hdfs中的數據和查看MapReduce的做業執行狀況。本文咱們將在hue中集成hive數據倉庫，用替代hive本身的hwi服務，能夠很方便的在hue中進行hive的sql查詢等操做。mysql

1、環境準備

1.hadoop集羣服務sql

2.hive-mysql元數據庫服務數據庫

3.hive服務api

4.hue4.1session

2、集成配置

打開hue的/desktop/conf/目錄下的 pseudo-distributed.ini文件 oracle

編輯pseudo-distributed.ini文件，找到[beeswax]這一節，修改信息鏈接爲hdpc01的機器上的Hive數據倉庫服務，修改信息以下：工具

hive_server_host=hdpc01oop

hive_server_port=10000spa

server_conn_timeout=120.net

list_partitions_limit=10000

query_partitions_limit=10

download_row_limit=100000

max_number_of_sessions=10

3、集成準備

1.啓動hadoop集羣

啓動hadoop三臺機器，而後在主節點機器上啓動hadoop集羣：start-all.sh

2.啓動Hiveserver服務

在hive機器上啓動hiveserver服務：hive --service hiveserver2 或者hive --service hiveserver2 &

3.啓動Hive Metastore服務

在hive機器上啓動Hive Metastore服務：hive --service metastore或者hive --service metastore &

看到以下信息，說明啓動完成：

4.啓動Hue服務

在hue的/bulid/env/bin/目錄下執行./supervisor 命令啓動hue服務

5.驗證啓動

在終端輸入jps -ml查看：

能夠看到hadoop集羣個hive服務啓動都正常

4、集成驗證及簡單使用

登錄Hue服務，點擊hive能夠看到hive的默認default的庫，和咱們以前使用hive時建的表

查看hive表的詳細信息，右擊表點擊Open in Browser在右邊的Table Browser視圖中，能夠看到表的結構及字段自定義、部分數據等

點擊columns標籤能夠看到表字段的詳細信息

點擊sample標籤能夠看到該表所有的數據信息

使用hue中的hive查詢器查詢hive表中的數據

在hue中還有更多能夠操做hive的方式，你們能夠本身嘗試別的，本文先這麼多基本的操做

5、問題總結

1.hue提示Could not start SASL: Error in sasl_client_start (-4) SASL(-4)的異常

問題緣由：由於系統缺乏了相關的依賴

解決辦法：咱們在hue所在主機安裝如下的依賴

yum install cyrus-sasl-plain cyrus-sasl-devel cyrus-sasl-gssapi

六、文末總結

文本的使用hue鏈接操做hive數據倉庫比較以前hive本身的hwi功能更強大，同時hue支持更多的應用，集成在一塊兒更像是一個操做、監控爲一體的平臺化的工具，在後面的文章咱們還繼續去使用hue集成HBase、mysql、oracle等

相關文章

相關標籤/搜索

數據庫與數據倉庫

hadoop&hive&hue

漫談數據倉庫

數據倉庫工具箱

大數據之數據倉庫

Oracle數據庫

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<