SparkStreaming概述

    Spark Streaming 是Spark核心API的一個擴展,可以實現高吞吐量的、具備容錯機制的實時流數據的處理。   ◆ 支持從多種數據源獲取數據,包括Kafka、Flume、Twitter、ZeroMQ、Kinesis   以及TCP sockets,從數據源獲取數據之後,可以使用諸如map、reduce、join   和window等高級函數進行復雜算法的處理。最後還可以將處理結
相關文章
相關標籤/搜索