Spark 是一種「One Stack to rule them all」通用的大數據計算框架,指望使用一個技術棧就完美地框架
解決大數據領域的各類計算任務。oop
Spark特色:速度快、容易上手開發、超強的通用性、集成Hadoop、極高的活躍度。性能
Spark的速度比MapReduce快:MR計算模型太死板,並且裏面最好性能的就是shuffle,shuffle大數據
中間的過程都是基於磁盤來讀寫的。而Spark是基於內存進行計算的。spa
Spark缺陷:Spark是基於內存進行計算的,若是數據量太大,沒有調優的狀況下,會出現OOM。orm
可是此時MR儘管運行速度慢,可是其能夠完成任務。blog
Spark替代的是Hive的查詢引擎,而不是Hive的所有!!!內存
Spark Streaming嚴格意義上來講,是一種準實時的計算框架。而Storm是真正意義上的實時計算框架。開發
Spark Streaming的吞吐量遠遠比Storm大。im