Spark計算過程分析

摘要: ### 基本概念----------Spark是一個分佈式的內存計算框架,其特色是能處理大規模數據,計算速度快。Spark延續了Hadoop的MapReduce計算模型,相比之下Spark的計算過程保持在內存中,減小了硬盤讀寫,可以將多個操做進行合併後計算,所以提高了計算速度。同時Spark也提供了更豐富的計算API。MapReduce是Hadoop和Spark的計算模型,其特色 編程 基
相關文章
相關標籤/搜索