Spark Streaming簡單入門(示例+原理)

概述 SparkStreaming是流式處理框架,是Spark API的擴展,支持可擴展、高吞吐量、容錯的實時數據流處理,實時數據的來源能夠是:Kafka, Flume, Twitter, ZeroMQ或者TCP sockets,而且可使用高級功能的複雜算子來處理流數據。例如:map,reduce,join,window 。最終,處理後的數據能夠存放在文件系統,數據庫等,方便實時展示。java 一
相關文章
相關標籤/搜索