Spark和Hadoop的區別

Spark是基於內存的一種計算框架(有時也會用磁盤,比如Spark Shuffle的時候),但是很多操作,比如單純的map操作,沒有reduce操作;或者是filter類的操作,都是可以直接基於內存進行計算的 MapReduce的計算模型非常固定,必須基於磁盤,以及大量的網絡傳輸 所以,Spark的速度可以比MapReduce,Hive快很多 SparkSQL只是替代Hive的計算引擎 Storm
相關文章
相關標籤/搜索