Spark簡介和RDD基本命令

1.Spark概念和特色 Spark是什麼 Apache Spark 是專爲大規模數據處理而設計的快速通用的計算引擎 是開源的,基於內存計算的大數據並行計算框架 由UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室) 開發 擁有Hadoop MapReduce的優勢, 同時避免讀寫HDFS Spark和Hadoop MR的關係 Spark 啓用了內存分佈數據集,提供交互式查
相關文章
相關標籤/搜索