SparkStreaming+kafak的direct模式邏輯分析(圖片展示+文字說明)

Sparkstreaming+kafka direct模式: 將kafka看成存儲數據的一方,sparkstreaming處理數據主動去拿數據,不需要一個task一直被佔用接受數據 sparkStreaming+kafka的direct模式的並行度:生成的dstream中的rdd的並行度與讀取的kafka的topic的partition個數一致。Direct模式相對於receiver模式來說簡化了
相關文章
相關標籤/搜索