Spark2.X環境準備、編譯部署及運行

  1.Spark概述 Spark 是一個用於大規模數據處理的快速和通用的計算引擎。 在速度方面, Spark 擴展了廣泛使用的 MapReduce 計算模型,而且高效地支持更多計算模式,包括交互式查詢和流處理。 在處理大規模數據集時,速度是非常重要的。速度快就意味着我們可以進行交互式的數據操作, 否則我們每次操作就需要等待數分鐘甚至數小時。 Spark 的一個主要特點是基於內存進行計算,因而更快
相關文章
相關標籤/搜索