大數據實戰(3)---實時流處理:Spark Streaming

1.概述 1)可擴展、高吞吐量、容錯的 2)將不同數據源數據經過Spark Streaming處理,將處理結果輸出到外部文件系統  特點:低延時、能從錯誤中高效的恢復:fault-tolerant、能夠運行在成百上千的節點、能夠將批處理、機器學習、圖計算等子框架和Spark Streaming綜合使用。 2.核心組件 基於Spark Core(離線處理)=>1)Spark Steaming 流處理
相關文章
相關標籤/搜索