flink計算一些報表需求的實現

最近在做一個報表的項目,5分鐘和小時的報表採用Flink計算,遇到下面幾個問題。 輸入的原始數據流包含了幾十個維度和指標字段,然後會抽取其中的2~3個維度和若干指標進行匯聚計算, 有些還需要計算分組TOPN,還有任務依賴,先計算3個維度,然後從3個維度計算兩個維度。 我當前的實現流圖是: 中間數據都是使用Row來傳遞,最後將Row轉換成Avro的Record寫入HDFS。 現在單個時間粒度要計算近
相關文章
相關標籤/搜索