《Hadoop大數據技術開發實戰》新書上線

時間 2020-05-12

原文原文鏈接

當今互聯網已進入大數據時代，大數據技術已普遍應用於金融、醫療、教育、電信、政府等領域。各行各業天天都在產生大量的數據，數據計量單位已從B、KB、MB、GB、TB發展到PB、EB、ZB、YB甚至BB、NB、DB。預計將來幾年，全球數據將呈爆炸式增加。谷歌、阿里巴巴、百度、京東等互聯網公司都急需掌握大數據技術的人才，而大數據相關人才卻出現了供不該求的情況。html

Hadoop做爲大數據生態系統中的核心框架，專爲離線和大規模數據處理而設計。Hadoop的核心組成HDFS爲海量數據提供了分佈式存儲；MapReduce則爲海量數據提供了分佈式計算。不少互聯網公司都使用Hadoop來實現公司的核心業務，例如華爲的雲計算平臺、淘寶的推薦系統等，只要和海量數據相關的領域都有Hadoop的身影。編程

本書做爲Hadoop及其周邊框架的入門書，知識面比較廣，涵蓋了當前整個Hadoop生態系統主流的大數據開發技術。內容全面，代碼可讀性強，以實操爲主，理論爲輔，一步一步手把手對經常使用的離線計算以及實時計算等系統進行了深刻講解。架構

全書共16章，第1章講解了VMware中CentOS 7操做系統的安裝；第2章講解了大數據開發以前對操做系統集羣環境的配置；第3~16章講解了Hadoop生態系統各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統Flume、Kafka、Storm、Spark以及分佈式搜索系統Elasticsearch等的基礎知識、架構原理、集羣環境搭建，同時包括經常使用的Shell命令、API操做、源碼剖析，並經過實際案例加深對各個框架的理解與應用。框架

那麼如何學習本書呢？分佈式

本書推薦的閱讀方式是按照章節順序從頭至尾完成閱讀，由於後面的不少章節是之前面的章節爲基礎，並且這種一步一個腳印、由淺入深的方式將使你更加順利地掌握大數據的開發技能。oop

學習本書時，首先根據第一、2章搭建好開發環境，而後依次學習第3~16章，學習每一章時先了解該章的基礎知識和框架的架構原理，而後再進行集羣環境搭建、Shell命令操做等實操練習，這樣學習效果會更好。當書中的理論和實操知識都掌握後，能夠進行觸類旁通，本身開發一個大數據程序，或者將所學知識運用到本身的編程項目上，也能夠到各類在線論壇與其餘大數據愛好者進行討論，互幫互助。學習

本書可做爲Hadoop新手入門的指導書籍或者大數據開發人員的參考用書，要求讀者具有必定的Java語言基礎和Linux系統基礎，即便沒有任何大數據基礎的讀者，也能夠對照書中的步驟成功搭建屬於本身的大數據集羣，是一本真正的提升讀者動手能力、以實操爲主的入門書籍。經過對本書的學習，讀者可以對大數據相關框架迅速理解並掌握，能夠熟練使用Hadoop集成環境進行大數據項目的開發。大數據

京東購買連接：雲計算

https://item.jd.com/12576717.html操作系統

噹噹購買連接：

http://product.dangdang.com/27941792.html