sparkstreaming消費kafka0.10中的LocationStrategies和ConsumerStrategies

LocationStrategies 新的Kafka使用者API將預先獲取消息到緩衝區。因此,出於性能原因,Spark集成將緩存的消費者保留在執行程序上(而不是爲每個批處理重新創建它們),並且更喜歡在具有適當使用者的主機位置上安排分區,這一點很重要。 在大多數情況下,您應該使用LocationStrategies.PreferConsistent,如上所示。這將在可用執行程序之間均勻分配分區。如果
相關文章
相關標籤/搜索