Spark之僞分佈式搭建、僞分佈式Hadoop、Hive安裝

時間 2019-11-13

標籤 spark 分佈式搭建 hadoop hive 安裝欄目 Spark 简体版

原文原文鏈接

怎麼在本地安裝Spark，這裏就再也不描述了。java

List-1docker

#在SPARK_HOME/conf下
>cp slaves.template slaves
#以後在slaves裏面寫入hostname，以下
>more slaves
mjduan-host


>cp spark-env.sh.template spark-env.sh
#修改spark-env.sh，寫入以下內容,SPARK_MASTER_IP寫mjduan-host
>more spark-env.sh 
export JAVA_HOME=/opt/software/tool/jdk1.8
export HADOOP_HOME=/opt/software/docker/hadoop/hadoop-2.7.7
export SCALA_HOME=/opt/software/tool/scala2.12
export HADOOP_CONF_DIR=/opt/software/docker/hadoop/hadoop-2.7.7/etc/hadoop
export SPARK_MASTER_IP=mjduan-host
export SPARK_WORKER_MEMORY=2048M

以後進入$SPARK_HOME/sbin下，執行start-all.sh，能夠看下是否啓動成功，以後去看localhost:8080，能夠看到spark的界面。bash

jps命令能夠看到有個Master和Worker。分佈式

注意，啓動Spark是能夠啓動的，可是若是往Spark上提交程序，Spark默認會從hdfs讀取數據，而不是本地。因此要安裝好HADOOP，安裝Hadoop的時候，帶上了hdfs、yarn都安裝好了。oop

給Spark提交任務，master後面的URL，若是不知道，能夠從日誌中看到或者Spark UI界面中看到。spa

List-2.net

spark-submit  --class com.mjduan.project.SimpleApp  --master spark://mjduan-host:7077  Spark-helloworld.jar

安裝Hadoop-2.7，Hive-2.3，參考: https://blog.csdn.net/u013332124/article/details/85223496 ，左邊安裝Hadoop的教程裏面，沒有設置yarn，要配置yarn，否則在hive命令行中進入insert時會報錯，配置yarn參考: https://blog.csdn.net/linbo_18874208784/article/details/74178236，在安裝Hive時，報用戶沒法訪問hive，要修改hive的配置文件，參考: https://stackoverflow.com/questions/40603714/hive-is-not-allowed-to-impersonate-hive命令行

Spark僞分佈式的安裝，參考: https://blog.csdn.net/zhihaoma/article/details/52296645scala

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。