Hive學習系列一--安裝部署

時間 2019-11-11

標籤 hive 學習系列安裝部署欄目 Hadoop 简体版

原文原文鏈接

Hive的認識java

Hive 是基於Hadoop 構建的一套數據倉庫分析系統，它提供了豐富的SQL查詢方式來分析存儲在Hadoop 分佈式文件系統中的數據，能夠將結構化的數據文件映射爲一張數據庫表，並提供完整的SQL查詢功能，能夠將SQL語句轉換爲MapReduce任務進行運行，經過本身的SQL 去查詢分析須要的內容，這套SQL 簡稱Hive SQL，使不熟悉mapreduce 的用戶很方便的利用SQL 語言查詢，彙總，分析數據。而mapreduce開發人員能夠把自己寫的mapper 和reducer 做爲插件來支持Hive 作更復雜的數據分析。
它與關係型數據庫的SQL 略有不一樣，但支持了絕大多數的語句如DDL、DML 以及常見的聚合函數、鏈接查詢、條件查詢。HIVE不適合用於聯機（online)事務處理，也不提供實時查詢功能。它最適合應用在基於大量不可變數據的批處理做業。

HIVE的特色：可伸縮（在Hadoop的集羣上動態的添加設備），可擴展，容錯，輸入格式的鬆散耦合數據庫

Hive的安裝步驟apache

前奏：hadoop版本2.6.0，hive版本1.2.1（開始安裝版本爲1.1.1，後發現不少問題，修改成1.2.1），jdk版本1.7app

一、下載apache-hive-1.1.1-bin.tar.gz複製到/opt目錄下解壓tar zxvf apache-hive-1.1.1-bin.tar.gz分佈式

二、進入conf目錄下，複製template文件函數

a) hive-default.xml.template --> hive-default.xmloop

b) hive-env.sh.template --> hive-env.shspa

c) hive-log4j.properties.template --> hive-log4j.properties插件

d) hive-exec-log4j.properties.template --> hive-exec-log4j.propertiesxml

三、修改hive-env.sh文件，打開下面的註釋

a) # export HADOOP_HEAPSIZE=1024

b) #HADOOP_HOME=/hadoop/hadoop-1.0.4

c) #export HIVE_CONF_DIR=/hive/hive-0.9.0/conf