Spark和Hadoop的區別

時間 2021-07-12

原文原文鏈接

Spark是基於內存的一種計算框架（有時也會用磁盤，比如Spark Shuffle的時候），但是很多操作，比如單純的map操作，沒有reduce操作；或者是filter類的操作，都是可以直接基於內存進行計算的 MapReduce的計算模型非常固定，必須基於磁盤，以及大量的網絡傳輸所以，Spark的速度可以比MapReduce，Hive快很多 SparkSQL只是替代Hive的計算引擎 Storm

>>阅读原文<<