Apache Flink 漫談系列(03) - Watermark

實際問題(亂序) 在介紹Watermark相關內容之前我們先拋出一個具體的問題,在實際的流式計算中數據到來的順序對計算結果的正確性有至關重要的影響,比如:某數據源中的某些數據由於某種原因(如:網絡原因,外部存儲自身原因)會有5秒的延時,也就是在實際時間的第1秒產生的數據有可能在第5秒中產生的數據之後到來(比如到Window處理節點).選具體某個delay的元素來說,假設在一個5秒的Tumble窗口
相關文章
相關標籤/搜索