Spark Streaming(二十四)初識SparkStreaming

定義 SparkStreaming是Spark核心API的擴展,類似與Apache Storm,但是它不是真正的是實時的,它是準實時的,也就是單位時間內做小批量的處理,它是可伸縮的、高可用的、容錯的、用來處理流式數據的。它能夠從Kafka、Flume、Kinesis、TCP socket中加載數據,加載進來的數據可以用map、reduce、join、window等抽象函數進行處理,最後處理的結果數
相關文章
相關標籤/搜索