下面列出我搭建hadoop應用環境的文章整理在一塊兒,不按期更新,供你們參考,互相學習!!!html
雜談篇:mysql
【英語學習】 Re-pick up English for learning big data (not updated regularly) linux
【轉】大數據工程師須要學習哪些? sql
【轉】大數據東西辣麼多,我該如何給本身一個清晰的定位呢? apache
【雜談】大數據主流技術簡介 服務器
第一篇 大數據主流技術之HADOOP部分框架
1.1 hadoop3.2.0的安裝並測試 eclipse
1.2 編譯Hadoop鏈接eclipse的插件碰見的一系列錯誤,崩潰的操做 分佈式
第二篇 大數據主流技術之HIVE與HBASE部分
2.2 centos7下apache-hive-3.1.2-bin的安裝測試
2.3 apache-zookeeper-3.5.5的安裝測試
2.4 hbase-2.2.1配置獨立的zookeeper的安裝與測試
第三篇 大數據主流技術之SQOOP與ZOOKEEPER部分
3.2 安裝部署kafka集羣(kafka版本:kafka_2.12-2.3.0)
第四篇 內存計算主流技術之SPARK與SCALA部分
4.4 scala&sbt+idea+spark使用過程當中問題彙總(不按期更新)
4.5 spark應用(分佈式估算圓周率+基於Spark MLlib的貸款風險預測)
腳本:
命令 :
Hadoop:
啓動:sbin/start-all.sh 或 start-dfs.sh + start-yarn.sh
中止:stop-all.sh
啓功歷史服務器:sbin/mr-jobhistory-daemon.sh start jobhistoryserver
注:因Hadoop和Spark啓動命令同樣,故在設置環境變量時只設置其中一個
MySQL:
啓動:service mysqld start
中止:service mysqld stop
狀態:service mysqld status
Spark:
啓動:sbin/start-all.sh
中止:stop-all.sh
idea:
啓動:bin/idea.s
文件分享:
連接:https://pan.baidu.com/s/1e6zz4p-rCbzzE5DxMA4eFw
提取碼:amdl