Spark Streaming

Spark Streaming 是一個批處理的流式計算框架。它的核心是Spark,適合處理實時數據與歷史數據混合處理的場景,並保證容錯性。 Spark Streaming是構建在Spark上的實時計算框架,擴展了Spark流式大數據處理能力。它將數據流以時間片單位進行分割形成RDD,使用RDD操作處理每一塊數據,每塊數據(RDD)都會生成一個Spark Job進行處理,最終的表現形式就是以批處理的
相關文章
相關標籤/搜索