Spark Streaming介紹以及案例

概觀 Spark Streaming是核心Spark API的擴展,可實現實時數據流的可擴展,高吞吐量,容錯流處理。 數據來源:Kafka,Flume,Kinesis或TCP套接字等, 可以使用高級函數進行復雜算法進行處理map,例如reduce,join和window。 處理後的數據可以推送到文件系統,數據庫等   它的工作原理: Spark Streaming接收實時輸入數據流並將數據分成批處
相關文章
相關標籤/搜索