Spark Streaming與Kafka集成編程

Spark Streaming是運行在Spark引擎之上實時處理工具,提供可擴展、高吞吐量、具備容錯能力實時數據流處理功能,經過把接收的數據流裏的數據分隔到一系列的批次,而後由Spark引擎處理生成結果 html Spark Streaming提供了高級別的抽象DStream用來表示連續的數據流,DStream其實就是RDDs的序列:java Spark Streaming與Kafka集成由於Ka
相關文章
相關標籤/搜索