論Spark Streaming的數據可靠性和一致性

摘要:Spark Streaming自發布起就得到了廣泛的關注,然而作爲一個年輕的項目,需要提升的地方同樣很多,比如1.2之前版本driver掛掉可能會丟失數據。這裏將分析它的可靠性機制。 眼下大數據領域最熱門的詞彙之一便是流計算了,其中最耀眼的項目無疑是來自Spark社區的Spark Streaming項目,其從一誕生就受到廣泛關注並迅速發展,目前已有追趕並超越Storm的架勢。 對於流計算而言
相關文章
相關標籤/搜索