SparkStreaming(三)離散流(DStream)

3、離散流(DStream) SparkStreaming使用」微批次」的架構,把流式計算當做一系列連續的小規模批處理來對待。SparkStreaming從各種輸入源中讀取數據,並把數據分組爲小的批次。新的批次按均勻的時間間隔創建出來。在每個時間區間開始的時候,一個新的批次就創建出來,在該區間內收到的數據都會被添加到這個批次中。在時間區間結束時,批次停止增長。時間區間的大小是由批處理間隔這個參數決
相關文章
相關標籤/搜索