spark on yarn做業執行流程

Spark是一個分佈式數據快速分析項目。它的核心技術是彈性分佈式數據集(Resilient Distributed Datasets),提供了比MapReduce豐富的模型,能夠快速在內存中對數據集進行屢次迭代,來支持複雜的數據挖掘算法和圖形計算算法。算法 Spark 的計算調度方式,從Mesos到Standalone,即自建Spark計算集羣。雖然Standalone方式性能與穩定性都獲得了提高
相關文章
相關標籤/搜索