實時流處理學習(一)

MapReduce 適合離線批處理 實時流處理產生背景: 時效性高 數據量大 實時計算與流計算對比: 實時計算:延遲性低 流式計算:不斷產生的數據流上計算 ==綜合==>實時流式計算   離線計算與實時計算的對比: 1) 數據來源 離線:HDFS 歷史數據,數據量比較大 實時:消息隊列(Kafka),實時新增/修改記錄過來的某一筆數據 2) 處理過程 離線:MapReduce 實時:Spark(D
相關文章
相關標籤/搜索