Structured Streaming編程模型

Structured Streaming 的核心思想是將實時數據流看作數據在不斷追加的表。這種思想促生了一種新的,和批處理模型非常類似的流處理模型。您可以像表示靜態數據標準批查詢一樣表示流計算。Spark 會在這個無界表上運行增量查詢。 目錄 1. 基本概念 2. 事件時間和遲到數據處理 3. 容錯機制 1. 基本概念 如果把輸入流看作是「Input Table」,那麼流中到達的每個數據元素都像是
相關文章
相關標籤/搜索