Flink狀態管理和容錯機制介紹

導讀:本文來自8月11日在北京舉行的 Flink Meetup會議,分享來自於施曉罡,目前在阿里大數據團隊部從事Blink方面的研發,如今主要負責Blink狀態管理和容錯相關技術的研發大數據

本文主要內容以下:spa

  • 有狀態的流數據處理;
  • Flink中的狀態接口;
  • 狀態管理和容錯機制實現;
  • 阿里相關工做介紹;

一.有狀態的流數據處理

1.1.什麼是有狀態的計算

計算任務的結果不單單依賴於輸入,還依賴於它的當前狀態,其實大多數的計算都是有狀態的計算。 好比wordcount,給一些word,其計算它的count,這是一個很常見的業務場景。count作爲輸出,在計算的過程當中要不斷的把輸入累加到count上去,那麼count就是一個state。接口

1.2.傳統的流計算系統缺乏對於程序狀態的有效支持

  • 狀態數據的存儲和訪問;
  • 狀態數據的備份和恢復;
  • 狀態數據的劃分和動態擴容;


01.jpg程序

相關文章
相關標籤/搜索