大數據學習之十六——hive的安裝以及表的基本操做

時間 2019-11-12

標籤數據學習十六 hive 安裝以及基本欄目 Hadoop 简体版

原文原文鏈接

1.概念瞭解mysql

hive是基於hadoop的一個數據倉庫工具，能夠將結構化的數據文件映射爲一個數據庫表，並提供簡單的sql查詢功能，能夠將sql語句轉換爲MapReduce任務進行運行。其優勢是學習成本低，能夠經過類SQL語句快速實現簡單的MapReduce統計，沒必要開發專門的MapReduce應用，十分適合數據倉庫的統計分析。jquery

2.hive的安裝sql

（1）修改配置文件數據庫

/etc/profile工具

並使用scource /etc/profile使配置生效oop

在HIVE_HOME目錄下，在conf/hive-env.sh中修改配置學習

修改hive-site.xml（原本是不存在的，能夠複製hive-default.xml，而後重命名爲hive-site.xml）3d

將<configuration></configuration>中的內容所有刪除，換成以下內容：xml

注意目錄和IP地址的改變！blog

在HIVE_HOME下，建立文件local和logs。

在HIVE_HOME/conf中的配置文件，將hive-exec-log4j.properties.template重命名爲：hive-exec-log4j.properties，將hive-log4j.properties.template重命名爲：hive-log4j.properties

並在兩個文件中修改內容：

（2）添加mysql驅動包放在HIVE_HOME/lib目錄下

（3）修改hadoop的庫文件
在$HADOOP_HOME/share/hadoop/yarn/lib下備份jline-0.9.94.jar
執行命令
$mv jline-0.9.94.jar jline-0.9.94.jar.bak
Copy高版本的jline
$cp $HIVE_HOME/lib/jline-2.12.jar $HADOOP_HOME /share/hadoop/yarn/lib

（4）驗證是否安裝成功：$hive

3.表的基本操做

（1）建立一個表名爲student01的內部表

• create table 建立一個指定名字的表。若是相同名字的表已經存在，則拋出異常；用戶能夠用 if not exists 選項來忽略這個異常

• external 關鍵字能夠讓用戶建立一個外部表，在建表的同時指定一個指向實際數據的路徑（location）,若是文件數據是純文本，能夠使用 stored as textfile ,若是數據須要壓縮，使用 stored as sequence 。

（2）建立一個表名爲student2的外部表

（3）展現表的元素

（4）向表中添加元素

（5）表名的更改

（6）表的刪除