成都大數據Hadoop與Spark技術培訓班

  • 成都大數據Hadoop與Spark技術培訓班
 

中國信息化培訓中心特推出了大數據技術架構及應用實戰課程培訓班,經過專業的大數據Hadoop與Spark技術架構體系與業界真實案例來全面提高大數據工程師、開發設計人員的工做水平,旨在培養專業的大數據Hadoop與Spark技術架構專家,更好地服務於各個行業的大數據項目開發和落地實施。算法

2015年近期公開課安排:(全國巡迴開班)數據庫

08月21日——08月23日大連編程

09月23日——09月25日北京性能優化

10月16日——10月18日成都架構

11月27日——11月29日深圳框架

12月24日——12月26日廣州運維

01月27日——01月29日杭州機器學習

招生對象:分佈式

大數據Hadoop與Spark技術的應用開發工程師函數

大數據分析與挖掘工程師

大數據集羣運維工程師

大數據項目的IT管理人員

大數據項目規劃的諮詢人員

對Hadoop與Spark大數據技術感興趣的愛好者

打算上線大數據項目及具備大數據應用需求的各行業的企業信息化技術與管理人員

具有必定的Java和Linux基礎的尤佳。

培訓證書:中國信息化培訓中心頒發的《大數據Hadoop開發高級架構師》證書。

收費標準:5800/

 

公開課培訓大綱:(內訓方案可定製)

日程

培訓模塊

培訓要點

第一天

上午

1、大數據技術基礎入門

1.大數據的產生背景、發展歷程

2.大數據和雲計算的關係

3.大數據應用需求以及潛在價值分析

4.業界最新的大數據技術發展態勢與應用趨勢

5.大數據項目的技術選型與架構設計

6.「互聯網+」時代下的電子商務、製造業、零售批發業、電信運營商、互聯網金融業、網上銀行、電子政務、移動互聯網、教育信息化等行業應用實踐與應用案例剖析

2、業界主流的大數據技術產品與項目解決方案

7.國內外主流的大數據解決方案介紹

8.當前大數據解決方案與傳統數據庫方案的剖析比較

9.Apache大數據平臺方案剖析

10.CDH大數據平臺方案剖析

11.HDP大數據平臺方案剖析

12.開源的大數據生態系統平臺剖析

3、Hadoop與Spark大數據處理平臺

13.Hadoop的發展歷程以及產業界的實際應用介紹

14.Hadoop大數據平臺架構,以及PB級大數據處理工做原理與機制

15.Hadoop的核心組件剖析

16.Spark的發展歷程以及業界的實際應用介紹

17.Spark實時大數據處理平臺架構,以及內存大數據處理工做原理與機制

18.Spark的核心組件剖析

第一天

下午

4、大數據採集與分佈式消息訂閱系統

19.Flume-NG數據採集系統的數據流模型、平臺架構、集羣部署與配置應用實戰

20.Kafka分佈式消息訂閱系統的應用介紹、平臺架構、集羣部署與配置應用實戰

21.Scribe分佈式日誌收集系統的簡介、工做原理、平臺架構、集羣部署與配置應用實戰

22.ZooKeeper分佈式協調服務系統的工做原理、平臺架構、集羣部署與配置應用實戰

5、大數據分佈式存儲系統

23.分佈式文件系統HDFS的簡介

24.HDFS系統的主從式平臺架構和工做原理

25.HDFS核心技術講解

26.HDFS應用開發實戰

27.HDFS集羣的安裝、部署、配置與性能優化技巧

28.分佈式鍵值存儲系統介紹、平臺架構、核心技術以及應用開發

29.PB及大數據存儲系統的項目案例分析

6、大數據MapReduce與Yarn並行處理平臺

30.MapReduce並行計算模型

31.MapReduce做業執行與調度技術

32.第二代大數據計算框架Yarn的工做原理以及DAG並行執行機制

33.MapReduce應用開發環境的部署,以及大數據並行處理應用程序開發

34.MapReduce高級編程技巧與性能優化實踐

35.MapReduce與Yarn項目案例實踐

次日

上午

7、大數據Spark實時處理平臺

36.內存計算模型和實時處理技術介紹

37.Spark分佈式實時處理框架及工做原理

38.Spark集羣的平臺架構及其生態系統組件剖析

39.Spark SQL應用實踐

40.Spark Streaming應用實踐

41.MLib/MLBase實時機器學習應用實踐

42.GraphX實時圖數據處理應用實踐

43.Spark實時處理集羣的安裝部署與配置優化

44.Spark的編程開發應用實戰

45.Spark與Hadoop的對接集成解決方案實踐

8、Storm流式數據處理平臺

46.Storm流式處理系統介紹、平臺架構以及工做原理

47.Storm集羣安裝部署與配置優化

48.Storm日誌分析項目應用實戰

次日

下午

9、HBase分佈式數據庫管理系統

49.NoSQL數據庫與NewSQL數據庫技術介紹,及其在半結構化和非結構化大數據方面的應用實踐

50.HBase分佈式數據庫簡介、數據模型以及工做原理

51.HBase分佈式數據庫集羣的平臺架構和關鍵技術剖析

52.HBase應用項目開發技巧,以及客戶端開發實戰

53.HBase表設計與數據操做以及數據庫管理API調用

54.HBase集羣的安裝部署與配置優化

55.HBase集羣的運維與監控管理

 

10、Cassandra數據管理系統

56.Cassandra數據存儲管理系統的應用介紹

57.Cassandra集羣的平臺架構以及核心關鍵技術

58.Cassandra一致性哈希算法與數據對象分佈策略

59.Cassandra集羣的安裝部署與配置優化

60.Cassandra應用開發實戰

第三天

上午

11、內存數據庫管理系統集羣

61.Impala實時查詢系統的應用介紹

62.Impala實時查詢系統平臺架構、核心關鍵技術剖析

63.Impala實時查詢系統的部署與應用開發實踐

64.Redis內存數據庫介紹,以及業界應用案例

65.Redis內存數據庫集羣架構以及核心技術剖析

66.Redis集羣的安裝部署與應用開發實戰

12、大型數據倉庫Hive集羣平臺

67.基於Hadoop的大型分佈式數據倉庫基礎知識,以及在行業中的應用實踐案例

68.基於Spark的實時數據倉庫集羣基礎知識,以及在行業中的應用實踐案例

69.Hive大數據倉庫簡介以及應用介紹

70.Hive數據倉庫集羣的平臺體系結構、核心技術剖析

71.Hive Server工做原理與應用技巧

72.Hive數據倉庫集羣的安裝部署與配置優化

73.Hive應用開發技巧

74.Hive QL定義以及應用

75.Hive數據倉庫表與表分區、表操做、數據導入導出、客戶端操做技巧

76.Hive數據倉庫報表設計、HWI、CLI客戶端演示以及用戶自定義函數(UDF)的開發實踐

第三天

下午

十3、Mahout大數據分析挖掘平臺

77.大數據分析挖掘技術介紹,以及行業大數據挖掘應用案例

78.Mahout大數據挖掘平臺的體系架構、核心算法與關鍵技術運用

79.基於Mahout的數據挖掘應用程序開發實戰

80.Mahout集羣的安裝部署與配置優化

81.集成Mahout與Hadoop集成大數據挖掘平臺應用實戰

十4、大數據智能化ETL操做以及Hadoop集羣運維監控工具平臺應用

82.Hadoop與DBMS之間進行數據轉換的框架

83.Sqoop導入導出數據的工做原理,以及Sqoop集羣安裝部署與配置

84.Kettle集羣的平臺架構、核心技術工做原理以及應用案例

85.Kettle集羣安裝部署與配置,以及應用開發實戰

86.利用Sqoop實現MySQL與Hadoop集羣之間的數據導入導出交互程序

87.Hadoop大數據運維監控系統HUE平臺的安裝部署與配置優化

十5、大數據項目應用實戰

88.根據佈置的實際應用案例,開展大數據完整項目部署設計和應用開發實踐

相關文章
相關標籤/搜索