Spark Streaming管理Kafka偏移量

前言 爲了讓Spark Streaming消費kafka的數據不丟數據,可以創建Kafka Direct DStream,由Spark Streaming自己管理offset,並不是存到zookeeper。啓用S​​park Streaming的 checkpoints是存儲偏移量的最簡單方法,因爲它可以在Spark的框架內輕鬆獲得。 checkpoints將應用程序的狀態保存到HDFS,以便在故
相關文章
相關標籤/搜索