環境搭建 Hadoop+Hive(orcfile格式)+Presto實現大數據存儲查詢一

時間 2019-11-08

標籤環境搭建 hadoop+hive hadoop hive orcfile 格式 presto 實現數據存儲查詢欄目 Hadoop 简体版

原文原文鏈接

1、前言java

Hadoop簡介node

Hadoop就是一個實現了Google雲計算系統的開源系統，包括並行計算模型Map/Reduce，分佈式文件系統HDFS，以及分佈式數據庫Hbase，同時Hadoop的相關項目也很豐富，包括ZooKeeper，Pig，Chukwa，Hive，Hbase，Mahout，flume等.接下來咱們使用的是Hivemysql

Hive簡介linux

Hive 是一個基於 Hadoop的開源數據倉庫工具，用於存儲和處理海量結構化數據。它把海量數據存儲於 hadoop 文件系統，而不是數據庫，但提供了一套類數據庫的數據存儲和處理機制，並採用 HQL （類 SQL ）語言對這些數據進行自動化管理和處理。咱們能夠把 Hive 中海量結構化數據當作一個個的表，而實際上這些數據是分佈式存儲在 HDFS 中的。 Hive 通過對語句進行解析和轉換，最終生成一系列基於 hadoop 的 map/reduce 任務，經過執行這些任務完成數據處理。sql

Presto簡介數據庫

Presto是一個開源的分佈式SQL查詢引擎，適用於交互式分析查詢，數據量支持GB到PB字節。Presto的設計和編寫徹底是爲了解決像Facebook這樣規模的商業數據倉庫的交互式分析和處理速度的問題。Presto支持在線數據查詢，包括Hive, Cassandra, 關係數據庫以及專有數據存儲。一條Presto查詢能夠將多個數據源的數據進行合併，能夠跨越整個組織進行分析。apache

2、環境準備centos

Hadoop2.X服務器

apache-hive-2.1.0jvm

presto-server-0.156.tar.gz

Mysql5.7

3、速度測試

4、本機服務器準備

　　虛擬機使用linux的centos

　　Hadoop 192.168.209.142,192.168.209.140

　　hive 192.168.209.140

　　presto 192.168.209.140

　　mysql 10.0.0.7

5、環境搭建

　　1.Hadoop環境搭建<略>

　　2.Hive環境搭建

　　解壓Hive文件

　　[root@HDP134 ~]# tar -zxvf /home/hive/apache-hive-2.1.0-bin.tar.gz

　　配置hive

　　[root@HDP134 ~]# vi /etc/profile

　　由於HIVE用到了Hadoop須要在最下邊加上hadoop和Hive的路徑

　　#Hadoop

　　export HADOOP_INSTALL=/opt/hadoop

　　export PATH=$PATH:$HADOOP_INSTALL/bin

　　export HADOOP_HOME=$HADOOP_INSTALL

　　#Hive

　　export HIVE_HOME=/home/hive/apache-hive-2.1.0-bin

　　export PATH=$PATH:$HIVE_HOME/bin

　　保存退出以後進入配置文件，複製並生命名hive-env.sh,hive-site.xml

　　[root@HDP134 ~]# cd /home/hive/apache-hive-2.1.0-bin/conf

　　[root@HDP134 ~]# cp hive-env.sh.template hive-env.sh

　　[root@HDP134 ~]# cp hive-default.xml.template hive-site.xml

　　配置hive-site.xml

　　替換hive-site.xml文件中的 ${system:java.io.tmpdir} 和 ${system:user.name}

　　默認狀況下, Hive的元數據保存在了內嵌的 derby 數據庫裏, 但通常狀況下生產環境使用 MySQL 來存放 Hive 元數據。

　　繼續修改Hive-site.xml配置Mysql

<property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8&amp;useSSL=false</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>hive</value> </property>