SparkStreaming中DStream的概念

1.DStream StreamingContext會根據設置的批處理的時間間隔將產生的rdd歸爲一批,這一批rdd就是一個DStream,DStream可以通過算子操作轉化爲另一個DStream 2.流計算的處理流程 SparkStreaming的數據來源是kafka、flume、hdfs等,其中用的最多的是kafka,次子是flume,SparkStreaming將接收到的數據進行分批處理,每
相關文章
相關標籤/搜索