Spark原理總結

一、Spark 是什麼    Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用分佈式並行計算框架。Spark擁有hadoop MapReduce所具有的優點,但和MapReduce 的最大不同之處在於Spark是基於內存的迭代式計算——Spark的Job處理的中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,除此之外,一個MapReduce
相關文章
相關標籤/搜索