超越Storm，SparkStreaming——Flink如何實現有狀態的計算

時間 2019-11-18

標籤超越 storm sparkstreaming flink 如何實現狀態計算欄目 Storm 简体版

原文原文鏈接

流式計算分爲無狀態和有狀態兩種狀況。無狀態計算觀察每一個獨立的事件，Storm就是無狀態的計算框架，每一條消息來了之後和先後都沒有關係，一條是一條。好比咱們接收電力系統傳感器的數據，當電壓超過240v就報警，這就是無狀態的數據。可是若是咱們須要同時判斷多個電壓，好比三相電路，咱們判斷三相電都高於某個值，那麼就須要將狀態保存，計算。由於這三條記錄是分別發送過來的。redis

Storm須要本身實現有狀態的計算，好比藉助於自定義的內存變量或者redis等系統，保證低延遲的狀況下本身去判斷實現有狀態的計算，可是Flink就不須要這樣，並且做爲新一代的流處理系統，Flink很是重視。算法

一致性

其實就是消息傳遞的正確性。在流處理中，一致性分爲 3 個級別。架構

at-most-once：最多一次，可能會丟失。框架
at-least-once：最少一次，可能會重複，而計算的時候可能就會屢次運算影響結果。異步
exactly-once：剛好保證一次，這樣獲得的結果是最準確的。async

最早保證 exactly-once 的系統（Storm Trident 和 Spark Streaming），可是在性能和表現力這兩個方面付出了很大的代價。爲了保證 exactly-once，這些系統沒法單獨地對每條記錄運用應用邏輯，而是同時處理多條（一批）記錄，保證對每一批的處理要麼所有成功，要麼所有失敗。這就致使在獲得結果前，必須等待一批記錄處理結束。所以，用戶常常不得不使用兩個流處理框架（一個用來保證 exactly-once，另外一個用來對每一個元素作低延遲處理），結果使基礎設施更加複雜。ide

可是，Flink解決了這種問題。工具

檢查點機制

檢查點是 Flink 最有價值的創新之一，由於它使 Flink 能夠保證 exactly-once，而且不須要犧牲性能。性能

Flink 檢查點的核心做用是確保狀態正確，即便遇到程序中斷，也要正確。記住這一基本點以後，咱們用一個例子來看檢查點是如何運行的。Flink 爲用戶提供了用來定義狀態的工具。例如，如下這個 Scala 程序按照輸入記錄的第一個字段（一個字符串）進行分組並維護第二個字段的計數狀態。大數據

val stream: DataStream[(String, Int)] = ... 
 
val counts: DataStream[(String, Int)] = stream   
.keyBy(record => record._1)   
.mapWithState((in: (String, Int), count: Option[Int]) =>     
  count match {       
  	case Some(c) => ( (in._1, c + in._2), Some(c + in._2) )       
  	case None => ( (in._1, in._2), Some(in._2) )     
})

該程序有兩個算子：keyBy 算子用來將記錄按照第一個元素（一個字符串）進行分組，根據該 key 將數據進行從新分區，而後將記錄再發送給下一個算子：有狀態的 map 算子（mapWithState）。 map 算子在接收到每一個元素後，將輸入記錄的第二個字段的數據加到現有總數中，再將更新過的元素髮射出去。

輸入流中的 6 條記錄被檢查點屏障（checkpoint barrier）隔開，全部的 map 算子狀態均爲0（計數還未開始）。全部 key 爲 a 的記錄將被頂層的 map 算子處理，全部 key 爲 b 的記錄將被中間層的 map 算子處理，全部 key 爲 c 的記錄則將被底層的 map 算子處理。

若是輸入流來自消息傳輸系統Kafka，這個相互隔離的位置就是偏移量。

檢查點屏障像普通記錄同樣在算子之間流動。當 map 算子處理完前 3 條記錄並收到檢查點屏障時，它們會將狀態以異步的方式寫入穩定存儲.

當沒有出現故障時，Flink 檢查點的開銷極小，檢查點操做的速度由穩定存儲的可用帶寬決定。

若是檢查點操做失敗，Flink 會丟棄該檢查點並繼續正常執行，由於以後的某一個檢查點可能會成功。

在這種狀況下，Flink 會從新拓撲（可能會獲取新的執行資源），將輸入流倒回到上一個檢查點，而後恢復狀態值並從該處開始繼續計算。

Flink 將輸入流倒回到上一個檢查點屏障的位置，同時恢復 map 算子的狀態值。而後，Flink 今後處開始從新處理。這樣作保證了在記錄被處理以後，map 算子的狀態值與沒有發生故障時的一致.

Flink 檢查點算法的正式名稱是異步屏障快照（asynchronous barrier snapshotting）。

保存點

狀態版本控制

檢查點由 Flink 自動生成，用來在故障發生時從新處理記錄，從而修正狀態。Flink 用戶還能夠經過另外一個特性有意識地管理狀態版本，這個特性叫做保存點（savepoint）。

保存點與檢查點的工做方式徹底相同，只不過它由用戶經過 Flink 命令行工具或者 Web 控制檯手動觸發，而不禁 Flink 自動觸發，用戶能夠從保存點重啓做業，而不用從頭開始。對保存點的另外一種理解是，它在明確的時間點保存應用程序狀態的版本。

在圖中，v.0 是某應用程序的一個正在運行的版本。咱們分別在 t1 時刻和 t2 時刻觸發了保存點。所以，能夠在任什麼時候候返回到這兩個時間點，而且重啓程序。更重要的是，能夠從保存點啓動被修改過的程序版本。舉例來講，能夠修改應用程序的代碼（假設稱新版本爲 v.1），而後從t1 時刻開始運行改動過的代碼。

使用保存點更新Flink 應用程序的版本。新版本能夠從舊版本生成的一個保存點處開始執行.

端到端的一致性

在該應用程序架構中，有狀態的Flink 應用程序消費來自消息隊列的數據，而後將數據寫入輸出系統，以供查詢。

輸入數據來自Kafka，在將狀態內容傳送到輸出存儲系統的過程當中，如何保證 exactly-once 呢？這叫做端到端的一致性。本質上有兩種實現方法，用哪種方法則取決於輸出存儲系統的類型，以及應用程序的需求。

(1) 第一種方法是在 sink 環節緩衝全部輸出，並在 sink 收到檢查點記錄時，將輸出「原子提交」到存儲系統。這種方法保證輸出存儲系統中只存在有一致性保障的結果，而且不會出現重複的數據。從本質上說，輸出存儲系統會參與 Flink 的檢查點操做。要作到這一點，輸出存儲系統須要具有「原子提交」的能力。

(2) 第二種方法是急切地將數據寫入輸出存儲系統，同時牢記這些數據可能是「髒」的，並且須要在發生故障時從新處理。若是發生故障，就須要將輸出、輸入和 Flink 做業所有回滾，從而將「髒」數據覆蓋，並將已經寫入輸出的「髒」數據刪除。注意，在不少狀況下，其實並無發生刪除操做。例如，若是新記錄只是覆蓋舊紀錄（而不是添加到輸出中），那麼「髒」數據只在檢查點之間短暫存在，而且最終會被修正過的新數據覆蓋。

根據輸出存儲系統的類型，Flink 及與之對應的鏈接器能夠一塊兒保證端到端的一致性，而且支持多種隔離級別。

更多Flink相關文章：

Streaming-大數據的將來

實時計算大數據處理的基石-Google Dataflow

數據架構的將來——淺談流處理架構

穿梭時空的實時計算框架——Flink對時間的處理

Flink快速入門--安裝與示例運行

大數據實時處理的王者-Flink

更多實時計算,Flink,Kafka等相關技術博文，歡迎關注實時流式計算：