《Spark與Hadoop大數據分析》——2.2　Apache Spark概述

時間 2020-12-30

原文原文鏈接

2.2　Apache Spark概述 Hadoop和MR已有10年曆史，已經被證明是高性能處理海量數據的最佳解決方案。然而，MR在迭代計算中性能不足，在這種情況下，多個MR作業之間的輸出必須被寫入 HDFS。在單個MR作業中，它的性能不足則是因爲MR框架存在的一些缺點所致。讓我們來看看計算趨勢的發展歷史，以便了解計算的格局在過去20年中的變化。這個趨勢是當網絡成本更低時（1990年代）對URI

>>阅读原文<<