這一兩年Spark技術很火,本身也湊熱鬧,反覆的試驗、研究,有痛苦萬分也有欣喜若狂,抽空把這些整理成文章共享給你們。這個系列基本上圍繞了Spark生態圈進行介紹,從Spark的簡介、編譯、部署,再到編程模型、運行架構,最後介紹其組件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章內容的整理通常是先介紹原理,隨後是實戰例子,因爲面向的是入門讀者,在實戰中多截圖,還請諒解。爲了你們實驗方便,在這裏把實驗相關的測試數據和安裝包放在百度盤提供 連接: https://pan.baidu.com/s/1mm9X95PstczvseZw0xj8Jw 密碼: t5kwhtml
本系列博客在博客園和CSDN首發,地址爲:編程
博客園 http://www.cnblogs.com/shishanyuan架構
CSDN http://blog.csdn.net/yirenboy機器學習
如下爲該系列文章列表:分佈式
1.Spark及其生態圈簡介 下載oop
2.Spark編譯與部署(中)--Hadoop編譯安裝 下載測試
2.Spark編譯與部署(下)--Spark編譯安裝 下載spa
3.Spark編程模型(上)--編程模型及SparkShell實戰 下載.net
7.Spark Streaming(上)--實時流計算Spark Streaming原理介紹 下載
7.Spark Streaming(下)--實時流計算Spark Streaming實戰 下載
8.Spark MLlib(上)--機器學習及SparkMLlib簡介 下載