Spark學習計劃

本文檔綜合如今市面上的各種spark書籍,歸納spark技術核心,「要事第一」原則,只抓核心,才能領悟實質。框架

spark核心分類:
1.環境配置相關(編譯、搭建、配置、啓動腳本)
    1.1 源碼編譯
    1.2 集羣搭建
    1.3 集羣配置,腳本分析
    1.4 IDE環境構建
2.Spark基礎
    2.1 RDD
        2.1.1 RDD基礎
        2.1.2 RDD算子
    2.2 共享變量
3.Spark工做機制
    3.1 調度管理
        3.1.1 做業提交流程
        3.1.2 通訊機制
    3.2 IO管理
    3.2 容錯機制
    3.4 監控管理
4.Spark框架
    4.1 Spark SQL
    4.2 Spark Streaming
    4.3 Spark MLlib
    4.4 Spark GraphX
相關文章
相關標籤/搜索