kafka 模式對比

時間 2021-01-22

標籤 Hadoop 欄目 Kafka 简体版

原文原文鏈接

Receiver是使用Kafka的高層次Consumer API來實現的。receiver從Kafka中獲取的數據都是存儲在Spark Executor的內存中的，然後Spark Streaming啓動的job會去處理那些數據。然而，在默認的配置下，這種方式可能會因爲底層的失敗而丟失數據。如果要啓用高可靠機制，讓數據零丟失，就必須啓用Spark Streaming的預寫日誌機制（Write Ahe

>>阅读原文<<