Spark原理篇之工作原理

1 Spark背景       Spark是一個加州大學伯克利分校(UC Berkeley AMP)開發的一個分佈式數據快速分析項目。它的核心技術是彈性分佈式數據集(Resilient distributed datasets),提供了比Hadoop更加豐富的MapReduce模型,可以快速在內存中對數據集進行多次迭代,來支持複雜的數據挖掘算法和圖計算算法。 2 Spark工作原理 2.1 Spa
相關文章
相關標籤/搜索