Spark(39) -- SparkStreaming -- 流式應用狀態

流式應用狀態 使用SparkStreaming處理實際實時應用業務時,針對不同業務需求,需要使用不同的函數。SparkStreaming流式計算框架,針對具體業務主要分爲三類,使用不同函數進行處理: 業務一:無狀態Stateless 使用transform和foreacRDD函數 比如實時增量數據ETL:實時從Kafka Topic中獲取數據,經過初步轉換操作,存儲到ES或HBase表中。 業務二
相關文章
相關標籤/搜索