PySpark 學習筆記六

6 Structured Streaming 6.1 What is Spark Streaming? Spark Streaming的核心是一個可擴展的容錯流系統,它採用RDD批處理模式(即批量處理數據)並加快速度。 如下圖所示,Spark Streaming接收輸入數據流,並在內部將該數據流分成多個較小的批次(其大小基於批處理間隔)。 Spark引擎將這些批量的輸入數據處理成批量的結果集。 S
相關文章
相關標籤/搜索