2.1 Spark簡介

1.Spark概述 Apache Spark 是專爲大規模數據處理而設計的快速通用的計算引擎。 Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用並行計算框架,Spark擁有Hadoop MapReduce所具有的優點; 但不同於MapReduce的是Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,
相關文章
相關標籤/搜索