Spark入門篇之簡介

Spark是Apache基金會的一個頂級項目,也是Apache基金會下目前最活躍的開源項目之一,誕生於加州大學伯克利分校的AMP實驗室,是一個開源的基於內存的分佈式計算框架。由於Spark是基於內存的計算,相對於MapReduce來說,提高了計算速度,同時Spark也提供了高容錯性和可擴展性。 1.## 速度快 基於內存的數據處理使得Spark比Mapreduce快100個數據量級以上,即使基於硬
相關文章
相關標籤/搜索