基於 Flink + Hive 構建流批一體準實時數倉

基於 Flink + Hive 構建流批一體準實時數倉 基於 Hive 的離線數倉往往是企業大數據生產系統中不可缺少的一環。Hive 數倉有很高的成熟度和穩定性,但由於它是離線的,延時很大。在一些對延時要求比較高的場景,需要另外搭建基於 Flink 的實時數倉,將鏈路延時降低到秒級。但是一套離線數倉加一套實時數倉的架構會帶來超過兩倍的資源消耗,甚至導致重複開發。  想要搭建流式鏈路就必須得拋棄現有
相關文章
相關標籤/搜索