實時流計算Spark Streaming原理介紹

1、Spark Streaming簡介 1.1 概述 Spark Streaming 是Spark核心API的一個擴展,可以實現高吞吐量的、具備容錯機制的實時流數據的處理。支持從多種數據源獲取數據,包括Kafka、Flume、Twitter、ZeroMQ、Kinesis 以及TCP sockets,從數據源獲取數據之後,可以使用諸如map、reduce、join和window等高級函數進行復雜算法
相關文章
相關標籤/搜索