Spark與Flink:對比與分析

Spark是一種快速、通用的計算集羣系統,Spark提出的最主要抽象概念是彈性分佈式數據集(RDD),它是一個元素集合,劃分到集羣的各個節點上,可以被並行操作。用戶也可以讓Spark保留一個RDD在內存中,使其能在並行操作中被有效的重複使用。Flink是可擴展的批處理和流式數據處理的數據處理平臺,設計思想主要來源於Hadoop、MPP數據庫、流式計算系統等,支持增量迭代計算。  原理  Spark
相關文章
相關標籤/搜索