Spark Streaming 介紹及架構——基礎篇

1 概述 Spark Streaming是Spark core API的擴展,支持實時數據流的處理,並且具有可擴展,高吞吐量,容錯的特點。 數據可以從許多來源獲取,如Kafka,Flume,Kinesis或TCP sockets,並且可以使用複雜的算法進行處理,這些算法使用諸如map,reduce,join和window等高級函數表示。 最後,處理後的數據可以推送到文件系統,數據庫等。 實際上,您
相關文章
相關標籤/搜索