Lambda架構通俗理解——離線 & 實時數據的一致性,kafka不丟數據的實現

採用Lambda架構的目的是保證實時和離線數據的一致性。 通俗簡單理解就是:kafka中的實時數據分兩個條線 (1)實時條線,通過Storm、SparkStreaming、Flink等大數據實時處理框架,將kafka中的數據進行實時處理,然後將計算邏輯封裝成jar包。 (2)離線條線,通過Hive等,當天結束後,對上面封裝成的jar包跑一遍,將離線數據分析結果導入數據應用層,覆蓋掉當天之前的實時數
相關文章
相關標籤/搜索