如何將kafka中的數據快速導入Hadoop？

時間 2020-12-25

原文原文鏈接

Kafka是一個分佈式發佈—訂閱系統，由於其強大的分佈式和性能特性，迅速成爲數據管道的關鍵部分。它可完成許多工作，例如消息傳遞、指標收集、流處理和日誌聚合。Kafka的另一個有效用途是將數據導入Hadoop。使用Kafka的關鍵原因是它將數據生產者和消費者分離，允許擁有多個獨立的生產者(可能由不同的開發團隊編寫)。同樣，還有多個獨立的消費者(也可能由不同的團隊編寫)。此外，消費者可以是實時/同步或

>>阅读原文<<