Spark學習(一)Spark及其生態圈簡介

1、什麼是Spark Apache Spark™是用於大規模數據處理的統一分析引擎。 Spark的通用性: 2、Spark的四大特性 (1)Speed:高效性 運行速度快  Spark擁有DAG執行引擎,支持在內存中對數據進行迭代計算。官方提供的數據表明,如果數據由磁盤讀取,速度是Hadoop MapReduce的10倍以上,如果數據從內存中讀取,速度可以高達100多倍。  (2)Ease of
相關文章
相關標籤/搜索