主流流處理框架比較

分佈式流處理是對無邊界數據集進行連續不斷的處理、聚合和分析。它跟 MapReduce 一樣是一種通用計算,但我們期望延遲在毫秒或者秒級別。這類系統一般採用有向無環圖(DAG)。 DAG 是任務鏈的圖形化表示,我們用它來描述流處理作業的拓撲。如下圖,數據從 sources 流經處理任務鏈到 sinks。單機可以運行 DAG,但本篇文章主要聚焦在多臺機器上運行 DAG 的情況。 關注點 當選擇不同的流
相關文章
相關標籤/搜索