Spark詳解(十二):Spark Streaming原理和實現

1 簡介 SparkStreaming是Spark核心API的一個擴展,具有高吞吐量和容錯能力的實時流數據處理系統,可以對多種數據源(如Kdfka、Flume、Twitter、Zero和TCP 套接字)進行類似Map、Reduce和Join等複雜操作,並將結果保存到外部文件系統、數據庫或應用到實時儀表盤。 Spark Streaming在內部處理的機制原理是:先接受實時流的數據,並根據一定的時間間
相關文章
相關標籤/搜索