Spark與Flink:對比與分析

Spark是一種快速、通用的計算集羣系統,Spark提出的最主要抽象概念是彈性分佈式數據集(RDD),它是一個元素集合,劃分到集羣的各個節點上,能夠被並行操做。用戶也可讓Spark保留一個RDD在內存中,使其能在並行操做中被有效的重複使用。Flink是可擴展的批處理和流式數據處理的數據處理平臺,設計思想主要來源於Hadoop、MPP數據庫、流式計算系統等,支持增量迭代計算。git 原理github
相關文章
相關標籤/搜索