成都大數據Hadoop與Spark技術培訓班

2015年近期公開課安排：（全國巡迴開班）數據庫

08月21日——08月23日大連編程

09月23日——09月25日北京性能優化

10月16日——10月18日成都架構

11月27日——11月29日深圳框架

12月24日——12月26日廣州運維

01月27日——01月29日杭州機器學習

招生對象：分佈式

大數據Hadoop與Spark技術的應用開發工程師函數

大數據分析與挖掘工程師

大數據集羣運維工程師

大數據項目的IT管理人員

大數據項目規劃的諮詢人員

對Hadoop與Spark大數據技術感興趣的愛好者

打算上線大數據項目及具備大數據應用需求的各行業的企業信息化技術與管理人員

具有必定的Java和Linux基礎的尤佳。

培訓證書：中國信息化培訓中心頒發的《大數據Hadoop開發高級架構師》證書。

收費標準：5800元/人

公開課培訓大綱：（內訓方案可定製）

日程	培訓模塊	培訓要點
第一天上午	1、大數據技術基礎入門	1.大數據的產生背景、發展歷程 2.大數據和雲計算的關係 3.大數據應用需求以及潛在價值分析 4.業界最新的大數據技術發展態勢與應用趨勢 5.大數據項目的技術選型與架構設計 6.「互聯網+」時代下的電子商務、製造業、零售批發業、電信運營商、互聯網金融業、網上銀行、電子政務、移動互聯網、教育信息化等行業應用實踐與應用案例剖析
	2、業界主流的大數據技術產品與項目解決方案	7.國內外主流的大數據解決方案介紹 8.當前大數據解決方案與傳統數據庫方案的剖析比較 9.Apache大數據平臺方案剖析 10.CDH大數據平臺方案剖析 11.HDP大數據平臺方案剖析 12.開源的大數據生態系統平臺剖析
	3、Hadoop與Spark大數據處理平臺	13.Hadoop的發展歷程以及產業界的實際應用介紹 14.Hadoop大數據平臺架構，以及PB級大數據處理工做原理與機制 15.Hadoop的核心組件剖析 16.Spark的發展歷程以及業界的實際應用介紹 17.Spark實時大數據處理平臺架構，以及內存大數據處理工做原理與機制 18.Spark的核心組件剖析
第一天下午	4、大數據採集與分佈式消息訂閱系統	19.Flume-NG數據採集系統的數據流模型、平臺架構、集羣部署與配置應用實戰 20.Kafka分佈式消息訂閱系統的應用介紹、平臺架構、集羣部署與配置應用實戰 21.Scribe分佈式日誌收集系統的簡介、工做原理、平臺架構、集羣部署與配置應用實戰 22.ZooKeeper分佈式協調服務系統的工做原理、平臺架構、集羣部署與配置應用實戰
	5、大數據分佈式存儲系統	23.分佈式文件系統HDFS的簡介 24.HDFS系統的主從式平臺架構和工做原理 25.HDFS核心技術講解 26.HDFS應用開發實戰 27.HDFS集羣的安裝、部署、配置與性能優化技巧 28.分佈式鍵值存儲系統介紹、平臺架構、核心技術以及應用開發 29.PB及大數據存儲系統的項目案例分析
	6、大數據MapReduce與Yarn並行處理平臺	30.MapReduce並行計算模型 31.MapReduce做業執行與調度技術 32.第二代大數據計算框架Yarn的工做原理以及DAG並行執行機制 33.MapReduce應用開發環境的部署，以及大數據並行處理應用程序開發 34.MapReduce高級編程技巧與性能優化實踐 35.MapReduce與Yarn項目案例實踐
次日上午	7、大數據Spark實時處理平臺	36.內存計算模型和實時處理技術介紹 37.Spark分佈式實時處理框架及工做原理 38.Spark集羣的平臺架構及其生態系統組件剖析 39.Spark SQL應用實踐 40.Spark Streaming應用實踐 41.MLib/MLBase實時機器學習應用實踐 42.GraphX實時圖數據處理應用實踐 43.Spark實時處理集羣的安裝部署與配置優化 44.Spark的編程開發應用實戰 45.Spark與Hadoop的對接集成解決方案實踐
次日上午	8、Storm流式數據處理平臺	46.Storm流式處理系統介紹、平臺架構以及工做原理 47.Storm集羣安裝部署與配置優化 48.Storm日誌分析項目應用實戰
次日下午	9、HBase分佈式數據庫管理系統	49.NoSQL數據庫與NewSQL數據庫技術介紹，及其在半結構化和非結構化大數據方面的應用實踐 50.HBase分佈式數據庫簡介、數據模型以及工做原理 51.HBase分佈式數據庫集羣的平臺架構和關鍵技術剖析 52.HBase應用項目開發技巧，以及客戶端開發實戰 53.HBase表設計與數據操做以及數據庫管理API調用 54.HBase集羣的安裝部署與配置優化 55.HBase集羣的運維與監控管理
	10、Cassandra數據管理系統	56.Cassandra數據存儲管理系統的應用介紹 57.Cassandra集羣的平臺架構以及核心關鍵技術 58.Cassandra一致性哈希算法與數據對象分佈策略 59.Cassandra集羣的安裝部署與配置優化 60.Cassandra應用開發實戰
第三天上午	11、內存數據庫管理系統集羣	61.Impala實時查詢系統的應用介紹 62.Impala實時查詢系統平臺架構、核心關鍵技術剖析 63.Impala實時查詢系統的部署與應用開發實踐 64.Redis內存數據庫介紹，以及業界應用案例 65.Redis內存數據庫集羣架構以及核心技術剖析 66.Redis集羣的安裝部署與應用開發實戰
第三天上午	12、大型數據倉庫Hive集羣平臺	67.基於Hadoop的大型分佈式數據倉庫基礎知識，以及在行業中的應用實踐案例 68.基於Spark的實時數據倉庫集羣基礎知識，以及在行業中的應用實踐案例 69.Hive大數據倉庫簡介以及應用介紹 70.Hive數據倉庫集羣的平臺體系結構、核心技術剖析 71.Hive Server工做原理與應用技巧 72.Hive數據倉庫集羣的安裝部署與配置優化 73.Hive應用開發技巧 74.Hive QL定義以及應用 75.Hive數據倉庫表與表分區、表操做、數據導入導出、客戶端操做技巧 76.Hive數據倉庫報表設計、HWI、CLI客戶端演示以及用戶自定義函數（UDF）的開發實踐
第三天下午	十3、Mahout大數據分析挖掘平臺	77.大數據分析挖掘技術介紹，以及行業大數據挖掘應用案例 78.Mahout大數據挖掘平臺的體系架構、核心算法與關鍵技術運用 79.基於Mahout的數據挖掘應用程序開發實戰 80.Mahout集羣的安裝部署與配置優化 81.集成Mahout與Hadoop集成大數據挖掘平臺應用實戰
	十4、大數據智能化ETL操做以及Hadoop集羣運維監控工具平臺應用	82.Hadoop與DBMS之間進行數據轉換的框架 83.Sqoop導入導出數據的工做原理，以及Sqoop集羣安裝部署與配置 84.Kettle集羣的平臺架構、核心技術工做原理以及應用案例 85.Kettle集羣安裝部署與配置，以及應用開發實戰 86.利用Sqoop實現MySQL與Hadoop集羣之間的數據導入導出交互程序 87.Hadoop大數據運維監控系統HUE平臺的安裝部署與配置優化
	十5、大數據項目應用實戰	88.根據佈置的實際應用案例，開展大數據完整項目部署設計和應用開發實踐