使用Zeppelin來實現大數據分析的可視化

Apache Zeppelin是ASF的一個孵化項目,實現了基於web的在線代碼編輯與數據可視化。有點相似Spark-Shell的REPL。其結果能夠直接用圖表來展現,解決了前端白癡的苦逼。
Zeppelin官網
咱們能夠直接下載 zeppelin-0.5.6-incubating-bin-all.tgz ,而後部署到服務器上,我的感受部署到Spark Master節點上會更好。修改好配置文件,而後輸入命令 $ZEPPELIN_HOME/bin/zeppelin-daemon.sh start啓動Zeppelin,就能夠在瀏覽器上操做Zeppelin了。
固然你也能夠下載源碼到本地經過maven編譯,不過總是有些依賴下載不下來,致使編譯失敗,最後仍是放棄了。。。前端

配置項:
Zeppelin環境變量:web

cp $ZEPPELIN_HOME/conf/zeppelin-env.sh.template $ZEPPELIN_HOME/conf/zeppelin-env.sh
vi $ZEPPELIN_HOME/conf/zeppelin-env.sh

在文件末尾增長以下配置項:
export JAVA_HOME= # JDK目錄
export MASTER= # spark://master:port
export ZEPPELIN_JAVA_OPTS= #啓動Zeppelin的參數。
export ZEPPELIN_NOTEBOOK_DIR="$ZEPPELIN_HOME/notebook" # 保存Zeppelin notbook的目錄,notebook能夠理解爲spark的applicationapache

export SPARK_HOME= # Spark目錄
export SPARK_SUBMIT_OPTIONS= #啓動spark application的參數,同spark-submit
export HADOOP_CONF_DIR="$HADOOP_PERFIX/etc/hadoop" # hadoop配置文件的目錄瀏覽器

zeppelin-site.xml服務器

cp $ZEPPELIN_HOME/conf/zeppelin-site.xml.template $ZEPPELIN_HOME/conf/zeppelin-site.xml
vi $ZEPPELIN_HOME/conf/zeppelin-site.xml

修改以下
<property>
<name>zeppelin.server.addr</name>
<value>192.168.1.123</value> <!-- 建議修改成本地的內網ip -->
<description>Server address</description>
</property>app

<property>
<name>zeppelin.server.port</name>
<value>28080</value> <!-- 8080容易衝突,建議修改,我是28080 -->
<description>Server port.</description>
</property>maven

經過以下命令啓動Zeppelinoop

$ZEPPELIN_HOME/bin/zeppelin-daemon.sh start

未完待續。。。spa

相關文章
相關標籤/搜索