論SparkStreaming的數據可靠性和一致性

轉自: http://www.csdn.net/article/2015-06-21/2825011   摘要:眼下大數據領域最熱門的詞彙之一便是流計算了,而其中最耀眼的無疑是來自Spark社區的SparkStreaming項目。 對於流計算而言,最核心的特點毫無疑問就是它對低時的需求,但這也帶來了相關的數據可靠性問題。 2Driver HA 由於流計算系統是長期運行、且不斷有數據流入,因此其Sp
相關文章
相關標籤/搜索