Spark Streaming入門

Spark Streaming是一個有趣且強大的Spark擴展,它支持流數據或者快速的移動數據的近實時處理。 Spark Streaming實現了一個叫作「微批」(micro-batching)的概念,它將在線/流數據劃分紅若干明確的微批,每一個微批做爲一條記錄被單獨處理。每一個微批的輸出結果被髮送到用戶定義的輸出流中,且能進一步存入HDFS、NoSQL,或者能夠生成實時控制板。 批的大小受限於可
相關文章
相關標籤/搜索