流式計算引擎-Storm、Spark Streaming

       目前經常使用的流式實時計算引擎分爲兩類:面向行和麪向微批處理,其中面向行的流式實時計算引擎的表明是Apache Storm,典型特色是延遲低,但吞吐率也低。而面向微批處理的流式實時計算引擎表明是Spark Streaming,其典型特色是延遲高,但吞吐率也高。架構 主流的流式數據線分四個階段:併發 一、數據採集:負責從不一樣數據源上實時採集數據,可選包括Flume以及自定義Kafka
相關文章
相關標籤/搜索