好程序員大數據教程分享Spark快速入門(72集視頻+源碼+筆記)

好程序員大數據教程分享Spark快速入門(72集視頻+源碼+筆記)
一、什麼是Spark?
Apache Spark是專爲大規模數據處理而設計的快速通用的計算引擎。Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用並行框架,Spark,擁有Hadoop MapReduce所具備的優勢;但不一樣於MapReduce的是——Job中間輸出結果能夠保存在內存中,從而再也不須要讀寫HDFS,所以Spark能更好地適用於數據挖掘與機器學習等須要迭代的MapReduce的算法。程序員

二、Spark具備哪些優勢?
(1)高級 API 剝離了對集羣自己的關注,Spark 應用開發者能夠專一於應用所要作的計算自己。
(2)Spark 很快,支持交互式計算和複雜算法。
(3)Spark 是一個通用引擎,可用它來完成各類各樣的運算,包括 SQL 查詢、文本處理、機器學習等,而在 Spark 出現以前,咱們通常須要學習各類各樣的引擎來分別處理這些需求。算法

三、Spark計算方法
(1)Bagel: Pregel on Spark,能夠用Spark進行圖計算,這是個很是有用的小項目。Bagel自帶了一個例子,實現了Google的PageRank算法。
(2)當下Spark已不止步於實時計算,目標直指通用大數據處理平臺,而終止Spark,開啓SparkSQL或許已經初見端倪。
(3)近年來國內外開始關注在 Spark 平臺上如何實現各類機器學習和數據挖掘並行化算法設計。爲了方便通常應用領域的數據分析人員使用所熟悉的 R 語言在 Spark 平臺上完成數據分析,Spark 提供了一個稱爲 SparkR 的編程接口,使得通常應用領域的數據分析人員能夠在 R 語言的環境裏方便地使用 Spark 的並行化編程接口和強大計算能力。編程

四、2019好程序員大數據教程-如何快速入門Spark?(72集視頻+源碼+筆記)
(1)本課適用人羣:
具備必定大數據基礎的人羣
(2)學完本視頻能掌握什麼?
本節課可以掌握Spark的環境搭建,任務調度流程,以及RDD代碼的應用。
(3)課程目錄:
第1章 Spark知識講解
01_爲何學習Spark
02_Spark和MapReduce的對比
03_Spark框架體系
04_Spark下載
05.Spark運行模式介紹
06.Spark集羣安裝
07.Spark程序執行流程
08.Spark相關名詞解釋
09_SparkShellLocal
10_SparkShellCluster
11_Spark2.2和Spark1.6Shell對比框架

第2章 Maven和IDEA
12_Maven和IDEA下載
13_Maven安裝
14_IDEA安裝
15_IDEA中配置Maven
16_Scala環境安裝和IDEA中配置Scala插件
17_IDEA建立Spark工程
18_Spark開發WordCount程序
19_Spark程序打包
20_Spark集羣運行打包程序機器學習

第3章 RDD知識講解
21_RDD概念
22_RDD執行流程
23_RDD屬性
24_RDD彈性
25_RDD的兩種建立
26_RDD編程API函數

第4章 Transformation算法
27_Transformation算法
28_Action算法
29_Map
30_filter
31_flatMap
32_sample
33 union
34 intersection
35 distinct
36 join
37_leftOuterJoin
38_rightOuterJoin
39_cartesian
40_groupBy
41_mapPartition
42_mapPartitionWithIndex
43_sortby
44_sortbykey
45_repartition
46_coalesce
47_partitionBy
48_repartitionAndSortWithinPartitions
49_reduce
50_reduceByKey
51_aggregateByKey
52_combineByKeyoop

第5章 Action算法
53_collect
54_count
55_top
56_take
57_takeOrdered
58_first
59_saveAsTextFile
60_foreach
61_其餘算子之countByKey
62_其餘算子之countByValue
63_其餘算子之filterByRange
64_其餘算子之flatMapValues
65_其餘算子之foreachPartition
66_其餘算子之keyBy
67_其餘算子之keys和values
68_其餘算子之collectAsMap
69_RDD函數傳遞
70_RDD的依賴關係
71_RDD任務劃分
72_Lineage血統
(4)免費視頻獲取方法:
方法一:關注vx公衆號「好程序員」,回覆「DT1」到本公衆號,便可免費領取《2019好程序員大數據之快速入玩轉Spark~連載(72集)》視頻教程以及免費的「源碼、筆記、配置軟件」!學習

相關文章
相關標籤/搜索