基於spark的流式數據處理—流計算

概念 流計算:實時獲取來自不同數據源的海量數據,經過實時分析處理,獲得有價值的信息。 流計算秉承一個基本理念,即數據的價值隨着時間的流逝而降低,如用戶點擊流。因此,當事件出現時就應該立即進行處理,而不是緩存起來進行批量處理。爲了及時處理流數據,就需要一個低延遲、可擴展、高可靠的處理引擎。 對於一個流計算系統來說,它應達到如下需求: 高性能:處理大數據的基本要求,如每秒處理幾十萬條數據; 海量式:支
相關文章
相關標籤/搜索