【大數據日記】【轉】The world beyond batch: Streaming 101(第三節)

時間窗口 剩下的兩種無界數據處理的方法都是時間窗口的變種。在介紹它們之前,我應該先明確時間窗口的含義。時間窗口就是將數據源(無界或者有界)沿着時間線劃分成有限的數據塊進行處理。下圖展示了三種不同的時間窗口模式: 圖8:窗口模式舉例。每種模式都展示了3個不同的 keys,來突出對齊窗口(應用到所有數據的窗口)和未對齊窗口(應用到數據子集的窗口)之間的區別。 固定窗口:固定窗口把時間劃分成固定時間長度
相關文章
相關標籤/搜索