Spark SQL 筆記(2)——Spark 生態圈和 Hadoop 生態圈對比

時間 2019-12-04

標籤 spark sql 筆記生態圈 hadoop 對比欄目 Spark 简体版

原文原文鏈接

1 Spark 產生的背景 1.1 MapReduce 的侷限性代碼繁瑣只可以支持map 和 reduce 方法；執行效率低；不適合屢次迭代、交互式、流式的處理； 1.2 框架多樣化批處理（離線）：MapReduce,Hive,Pig 流式處理（實時）：Storm,JStorm, 交互式計算：Impala 1.3 Hadoop 生態系統 1.4 Spark 生態系統（BDAS） BDAS

>>阅读原文<<