互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失:第一篇

背景引入

這篇文章,咱們來聊聊在線上生產環境使用消息中間件技術的時候,從前到後的全鏈路到底如何保證數據不能丟失。html

這個問題,在互聯網公司面試的時候高頻出現,並且也是很是現實的生產環境問題。面試

若是你的簡歷中寫了本身熟悉MQ技術(RabbitMQ、RocketMQ、Kafka),並且在項目裏有使用的經驗,那麼很是實際的一個生產環境問題就是:投遞消息到MQ,而後從MQ消費消息來處理的這個過程,數據到底會不會丟失。緩存

面試官此時會問:若是數據會丟失的話,大家項目生產部署的時候,是經過什麼手段保證基於MQ傳輸的數據100%不會丟失的?麻煩結合大家線上使用的消息中間件來具體說說大家的技術方案。微信

這個其實就是很是區分面試候選人技術水平的一個問題。網絡

實際上至關大比例的普通工程師,哪怕是在一些中小型互聯網公司裏工做過的,也就是基於公司部署的MQ集羣簡單的使用一下罷了,可能代碼層面就是基本的發送消息和消費消息,基本沒考慮太多的技術方案。架構

可是實際上,對於MQ、緩存、分庫分表、NoSQL等各式各種的技術以及中間件在使用的時候,都會有對應技術相關的一堆生產環境問題。3d

那麼針對這些問題,就必需要有相對應的一整套技術方案來保證系統的健壯性、穩定性以及高可用性。htm

因此其實中大型互聯網公司的面試官在面試候選人的時候,若是考察對MQ相關技術的經驗和掌握程度,十有八九都會拋出這個使用MQ時必定會涉及的數據丟失問題。由於這個問題,可以很是好的區分候選人的技術水平。中間件

因此這篇文章,咱們就來具體聊聊基於RabbitMQ這種消息中間件的背景下,從投遞消息到MQ,到從MQ消費消息出來,這個過程當中有哪些數據丟失的風險和可能。blog

而後咱們再一塊兒來看看,應該如何結合MQ自身提供的一些技術特性來保證數據不丟失?

前情回顧

首先給大夥一點提醒,有些新同窗可能還對MQ相關技術不太瞭解,建議看一下以前的MQ系列文章,看看MQ的基本使用和原理:

另外,其實以前咱們有過2篇文章是討論消息中間件的數據不丟失問題的。

咱們分別從消費者忽然宕機可能致使數據丟失,以及集羣忽然崩潰可能致使的數據丟失兩個角度討論了一下數據如何不丟失。

只不過僅僅那兩個方案還沒法保證全鏈路數據不丟失,可是你們若是沒看過的建議也先回過頭看看:

總之,但願對MQ不太熟悉的同窗,先把前面那些系列文章熟悉一下,而後再來一塊兒系統性的研究一下MQ數據如何作到100%不丟失。

目前已有的技術方案

通過以前幾篇文章的討論,目前咱們已經初步知道,第一個會致使數據丟失的地方,就是消費者獲取到消息以後,沒有來得及處理完畢,本身直接宕機了。

此時RabbitMQ的自動ack機制會通知MQ集羣這條消息已經處理好了,MQ集羣就會刪除這條消息。

那麼這條消息不就丟失了麼?不會有任何一個消費者處理到這條消息了。

因此以前咱們詳細討論過,經過在消費者服務中調整爲手動ack機制,來確保消息必定是已經成功處理完了,纔會發送ack通知給MQ集羣。

不然沒發送ack以前消費者服務宕機,此時MQ集羣會自動感知到,而後重發消息給其餘的消費者服務實例。

《扎心!線上服務宕機時,如何保證數據100%不丟失?》這篇文章,詳細討論了這個問題,手動ack機制之下的架構圖以下所示:

當時除了這個數據丟失問題以外,還有另一個問題,就是MQ集羣自身若是忽然宕機,是否是會致使數據丟失?

默認狀況下是確定會的,由於queue和message都沒采用持久化的方式來投遞,因此MQ集羣重啓會致使部分數據丟失。

因此《消息中間件集羣崩潰,如何保證百萬生產數據不丟失?》這篇文章,咱們分析瞭如何採用持久化的方式來建立queue,同時採用持久化的方式來投遞消息到MQ集羣,這樣MQ集羣會將消息持久化到磁盤上去。

此時若是消息還沒來得及投遞給消費者服務,而後MQ集羣忽然宕機了,數據是不會丟失的,由於MQ集羣重啓以後會自動從磁盤文件里加載出來沒投遞出去的消息,而後繼續投遞給消費者服務。

一樣,該方案沉澱下來的系統架構圖,以下所示:

數據100%不丟失了嗎?

你們想想,到目前爲止,我們的架構必定能夠保證數據不丟失了嗎?

其實,如今的架構,仍是有一個數據可能會丟失的問題。

那就是上面做爲生產者的訂單服務把消息投遞到MQ集羣以後,暫時還駐留在MQ的內存裏,還沒來得及持久化到磁盤上,同時也還沒來得及投遞到做爲消費者的倉儲服務。

此時要是MQ集羣自身忽然宕機,咋辦呢?

尷尬了吧,駐留在內存裏的數據是必定會丟失的,咱們來看看下面的圖示。

按需制定技術方案

如今,咱們須要考慮的技術方案是:訂單服務如何保證消息必定已經持久化到磁盤?

實際上,做爲生產者的訂單服務把消息投遞到MQ集羣的過程是很容易丟數據的。

好比說網絡出了點什麼故障,數據壓根兒沒傳輸過去,或者就是上面說的消息剛剛被MQ接收可是還駐留在內存裏,沒落地到磁盤上,此時MQ集羣宕機就會丟數據。

因此首先,咱們得考慮一下做爲生產者的訂單服務要如何利用RabbitMQ提供的相關功能來實現一個技術方案。

這個技術方案須要保證:只要訂單服務發送出去的消息確認成功了,此時MQ集羣就必定已經將消息持久化到磁盤了

咱們必須實現這樣的一個效果,才能保證投遞到MQ集羣的數據是不會丟失的。

須要研究的技術細節

這裏咱們須要研究的技術細節是:倉儲服務手動ack保證數據不丟失的實現原理。

以前,筆者就收到不少同窗提問:

  • 倉儲服務那塊究竟是如何基於手動ack就能夠實現數據不丟失的?
  • RabbitMQ底層實現的細節和原理究竟是什麼?
  • 爲何倉儲服務沒發送ack就宕機了,RabbitMQ能夠自動感知到他宕機了,而後自動重發消息給其餘的倉儲服務實例呢?

這些東西背後的實現原理和底層細節,究竟是什麼?

大夥兒稍安勿躁,接下來,我們會經過一系列文章,仔細探究一下這背後的原理。

互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失:第二篇
互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失:第三篇
互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失:第四篇

來源:【微信公衆號 - 石杉的架構筆記】

相關文章
相關標籤/搜索