Spark SQL 筆記(2)——Spark 生態圈和 Hadoop 生態圈對比

1 Spark 產生的背景 1.1 MapReduce 的侷限性 代碼繁瑣 只可以支持map 和 reduce 方法; 執行效率低; 不適合屢次迭代、交互式、流式的處理; 1.2 框架多樣化 批處理(離線):MapReduce,Hive,Pig 流式處理(實時):Storm,JStorm, 交互式計算:Impala 1.3 Hadoop 生態系統 1.4 Spark 生態系統(BDAS) BDAS
相關文章
相關標籤/搜索