淺談Apache Flink和Apache Spark的異同與發展前景

1、抽象 Abstraction Spark中,對於批處理我們有RDD,對於流式,我們有DStream,不過內部實際還是RDD.所以所有的數據表示本質上還是RDD抽象。後面我會重點從不同的角度對比這兩者。在Flink中,對於批處理有DataSet,對於流式我們有DataStreams。看起來和Spark類似,他們的不同點在於: (一)DataSet在運行時是表現爲運行計劃(runtime plan
相關文章
相關標籤/搜索