Spark Streaming如何使用checkpoint容錯

在互聯網場景下,經常會有各種實時的數據處理,這種處理方式也就是流式計算,延遲通常也在毫秒級或者秒級,比較有代表性的幾個開源框架,分別是Storm,Spark Streaming和Filnk。  曾經在一個項目裏面用過阿里改造後的JStrom,整體感受就是編程略複雜,在不使用Trident Api的時候是不能保證準確一次的數據處理的,但是能保證不丟數據,但是不保證數據重複,我們在使用期間也出現過幾次
相關文章
相關標籤/搜索