1.概念瞭解mysql
hive是基於hadoop的一個數據倉庫工具,能夠將結構化的數據文件映射爲一個數據庫表,並提供簡單的sql查詢功能,能夠將sql語句轉換爲MapReduce任務進行運行。其優勢是學習成本低,能夠經過類SQL語句快速實現簡單的MapReduce統計,沒必要開發專門的MapReduce應用,十分適合數據倉庫的統計分析。jquery
2.hive的安裝sql
(1)修改配置文件數據庫
/etc/profile工具
並使用scource /etc/profile使配置生效oop
在HIVE_HOME目錄下,在conf/hive-env.sh中修改配置學習
修改hive-site.xml(原本是不存在的,能夠複製hive-default.xml,而後重命名爲hive-site.xml)3d
將<configuration></configuration>中的內容所有刪除,換成以下內容:xml
注意目錄和IP地址的改變!blog
在HIVE_HOME下,建立文件local和logs。
在HIVE_HOME/conf中的配置文件,將hive-exec-log4j.properties.template重命名爲:hive-exec-log4j.properties,將hive-log4j.properties.template重命名爲:hive-log4j.properties
並在兩個文件中修改內容:
(2)添加mysql驅動包放在HIVE_HOME/lib目錄下
(3)修改hadoop的庫文件
在$HADOOP_HOME/share/hadoop/yarn/lib下備份jline-0.9.94.jar
執行命令
$mv jline-0.9.94.jar jline-0.9.94.jar.bak
Copy高版本的jline
$cp $HIVE_HOME/lib/jline-2.12.jar $HADOOP_HOME /share/hadoop/yarn/lib
(4)驗證是否安裝成功:$hive
3.表的基本操做
(1)建立一個表名爲student01的內部表
• create table 建立一個指定名字的表。若是相同名字的表已經存在,則拋出異常;用戶能夠用 if not exists 選項來忽略這個異常
• external 關鍵字能夠讓用戶建立一個外部表,在建表的同時指定一個指向實際數據的路徑(location),若是文件數據是純文本,能夠使用 stored as textfile ,若是數據須要壓縮,使用 stored as sequence 。
(2)建立一個表名爲student2的外部表
(3)展現表的元素
(4)向表中添加元素
(5)表名的更改
(6)表的刪除