這本書由宋立桓老師和陳建平老師共同合做,本書的切入點明確而清晰,從Hadoop 生態明星 Cloudera 入手,單刀直入逐步引出各種大數據基礎和核心應用框架。 全書系統介紹了大數據的相關知識,全書共十八章(宋立桓老師撰寫第一章到第十二章、陳建平撰寫第十三章到第十八章),從大數據概述、Cloudera hadoop平臺的安裝部署、並對大數據hadoop組件分別進行介紹,包括HDFS分佈式文件系統、MapReduce計算框架、資源管理框架YARN 、hive數據倉庫、數據遷移工具Sqoop、分佈式數據庫HBase、Zookeeper分佈式協調服務、準實時分析系統Impala、分佈式消息系統Kafka、ETL工具Kettle、Spark計算框架等知識,最後有兩個綜合實操案例把全部知識點串起來。本書使用的操做環境是hadoop的商業發行版的Cloudera express(express是免費版本,企業版需付費),全書秉承「實踐爲主、理論夠用」,將演示實驗融入到各個知識點講解中。
本書圖書資源下載地址連接:https://pan.baidu.com/s/1-P7Go5gdJLim33_Iju1rfg
提取碼:d1tk
若是不能訪問,能夠發郵件給我songlihuan@hotmail.com 索取最新網盤地址
購書連接
噹噹網
http://product.dangdang.com/26485741.html
天貓
https://detail.tmall.com/item.htm?spm=a230r.1.14.8.5fe05ced5hYL7F&id=585884706042&cm_id=140105335569ed55e27b&abbucket=4html