Spark Streaming總結-----學習筆記

支持多種數據源:Kafka、Flume、HDFS、普通TCP套接字等; 基本原理:實時輸入數據流以時間片(秒級)爲單位進行拆分,然後經Spark引擎以類似批處理的方式處理每個時間片數據; Spark Streaming最主要的抽象是DStream(Discretized Stream,離散化數據流),表示連續不斷的數據流。在內部實現上,Spark Streaming的輸入數據按照時間片(如1秒)分
相關文章
相關標籤/搜索