Lambda架構通俗理解——離線 & 實時數據的一致性，kafka不丟數據的實現

時間 2021-01-15

原文原文鏈接

採用Lambda架構的目的是保證實時和離線數據的一致性。通俗簡單理解就是：kafka中的實時數據分兩個條線（1）實時條線，通過Storm、SparkStreaming、Flink等大數據實時處理框架，將kafka中的數據進行實時處理，然後將計算邏輯封裝成jar包。（2）離線條線，通過Hive等，當天結束後，對上面封裝成的jar包跑一遍，將離線數據分析結果導入數據應用層，覆蓋掉當天之前的實時數

>>阅读原文<<