初識Flink WaterMarker

前言 對於流計算來講,最核心的概念就是無窮數據集,而用來處理無窮數據集的計算就能夠稱爲流計算。面對無窮數據集,有多種多樣的處理方式,可是大體上能夠分爲四類: 一、時間無關:最基礎的場景就是Filter,咱們只關心咱們想要的數據,這跟數據源是不是無窮的、失序都沒有關係了。 二、近似算法:好比近似Top-N、流K-means聚類等。他們都以無窮數據爲輸入,並計算出差很少你想要的結果。 三、窗口:而窗口
相關文章
相關標籤/搜索