大數據學習之十六——hive的安裝以及表的基本操做

1.概念瞭解mysql

hive是基於hadoop的一個數據倉庫工具,能夠將結構化的數據文件映射爲一個數據庫表,並提供簡單的sql查詢功能,能夠將sql語句轉換爲MapReduce任務進行運行。其優勢是學習成本低,能夠經過類SQL語句快速實現簡單的MapReduce統計,沒必要開發專門的MapReduce應用,十分適合數據倉庫的統計分析。jquery

2.hive的安裝sql

(1)修改配置文件數據庫

/etc/profile工具

並使用scource /etc/profile使配置生效oop

在HIVE_HOME目錄下,在conf/hive-env.sh中修改配置學習

修改hive-site.xml(原本是不存在的,能夠複製hive-default.xml,而後重命名爲hive-site.xml)3d

將<configuration></configuration>中的內容所有刪除,換成以下內容:xml

注意目錄和IP地址的改變!blog

在HIVE_HOME下,建立文件local和logs。

在HIVE_HOME/conf中的配置文件,將hive-exec-log4j.properties.template重命名爲:hive-exec-log4j.properties,將hive-log4j.properties.template重命名爲:hive-log4j.properties

並在兩個文件中修改內容:

(2)添加mysql驅動包放在HIVE_HOME/lib目錄下

(3)修改hadoop的庫文件
在$HADOOP_HOME/share/hadoop/yarn/lib下備份jline-0.9.94.jar
執行命令
$mv jline-0.9.94.jar jline-0.9.94.jar.bak
Copy高版本的jline
$cp $HIVE_HOME/lib/jline-2.12.jar $HADOOP_HOME /share/hadoop/yarn/lib

(4)驗證是否安裝成功:$hive

 

3.表的基本操做

(1)建立一個表名爲student01的內部表

• create  table 建立一個指定名字的表。若是相同名字的表已經存在,則拋出異常;用戶能夠用 if  not   exists 選項來忽略這個異常

• external 關鍵字能夠讓用戶建立一個外部表,在建表的同時指定一個指向實際數據的路徑(location),若是文件數據是純文本,能夠使用 stored  as  textfile ,若是數據須要壓縮,使用 stored  as  sequence 。

(2)建立一個表名爲student2的外部表

(3)展現表的元素

(4)向表中添加元素

(5)表名的更改

(6)表的刪除

相關文章
相關標籤/搜索