互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失(2)【石杉的架構筆記】

歡迎關注我的公衆號:石杉的架構筆記(ID:shishan100)面試

週一至週五早8點半!精品技術文章準時送上!算法

目錄性能優化

(1)前情提示bash

(2)ack機制回顧服務器

(3)ack機制實現原理:delivery tag網絡

(4)RabbitMQ如何感知倉儲服務實例宕機架構

(5)倉儲服務處理失敗時的消息重發併發

(6)階段總結分佈式

一、前情提示

上一篇文章互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失(1),咱們初步介紹了以前制定的那些消息中間件數據不丟失的技術方案遺留的問題。微服務

一個最大的問題,就是生產者投遞出去的消息,可能會丟失。

丟失的緣由有不少,好比消息在網絡傳輸到一半的時候由於網絡故障就丟了,或者是消息投遞到MQ的內存時,MQ突發故障宕機致使消息就丟失了。

針對這種生產者投遞數據丟失的問題,RabbitMQ其實是提供了一些機制的。

好比,有一種重量級的機制,就是事務消息機制。採用類事務的機制把消息投遞到MQ,能夠保證消息不丟失,可是性能極差,通過測試性能會呈現幾百倍的降低。

因此說如今通常是不會用這種過於重量級的機制,而是會用輕量級的confirm機制。

可是咱們這篇文章還不能直接講解生產者保證消息不丟失的confirm機制,由於這種confirm機制其實是採用了相似消費者的ack機制來實現的。

因此,要深刻理解confirm機制,咱們得先從這篇文章開始,深刻的分析一下消費者手動ack機制保證消息不丟失的底層原理。

二、ack機制回顧

其實手動ack機制很是的簡單,必需要消費者確保本身處理完畢了一個消息,才能手動發送ack給MQ,MQ收到ack以後纔會刪除這個消息。

若是消費者還沒發送ack,本身就宕機了,此時MQ感知到他的宕機,就會從新投遞這條消息給其餘的消費者實例。

經過這種機制保證消費者實例宕機的時候,數據是不會丟失的。

再次提醒一下你們,若是還對手動ack機制不太熟悉的同窗,能夠回頭看一下以前的一篇文章:扎心!線上服務宕機時,如何保證數據100%不丟失?。而後這篇文章,咱們將繼續深刻探討一下ack機制的實現原理。

三、ack機制實現原理:delivery tag

若是你寫好了一個消費者服務的代碼,讓他開始從RabbitMQ消費數據,這時這個消費者服務實例就會本身註冊到RabbitMQ。

因此,RabbitMQ實際上是知道有哪些消費者服務實例存在的。

你們看看下面的圖,直觀的感覺一下:

如圖不清晰請移步同名公衆號 接着,RabbitMQ就會經過本身內部的一個「basic.delivery」方法來投遞消息到倉儲服務裏去,讓他消費消息。

投遞的時候,會給此次消息的投遞帶上一個重要的東西,就是「delivery tag」,你能夠認爲是本次消息投遞的一個惟一標識。

這個所謂的惟一標識,有點相似於一個ID,好比說消息本次投遞到一個倉儲服務實例的惟一ID。經過這個惟一ID,咱們就能夠定位一次消息投遞。

因此這個delivery tag機制不要看很簡單,實際上他是後面要說的不少機制的核心基礎。

並且這裏要給你們強調另一個概念,就是每一個消費者從RabbitMQ獲取消息的時候,都是經過一個channel的概念來進行的。

你們回看一下下面的消費者代碼片斷,咱們必須是先對指定機器上部署的RabbitMQ創建鏈接,而後經過這個鏈接獲取一個channel。

並且若是你們還有點印象的話,咱們在倉儲服務裏對消息的消費、ack等操做,所有都是基於這個channel來進行的,channel又有點相似因而咱們跟RabbitMQ進行通訊的這麼一個句柄,好比看看下面的代碼:

另外這裏提一句:以前寫那篇文章講解手動ack保證數據不丟失的時候,有不少人提出疑問:爲何上面代碼裏直接是try finally,若是代碼有異常,那仍是會直接執行finally裏的手動ack?其實很簡單,本身加上catch就能夠了。

好的,我們繼續。你大概能夠認爲這個channel就是進行數據傳輸的一個管道吧。對於每一個channel而言,一個「delivery tag」就能夠惟一的標識一次消息投遞,這個delivery tag大體而言就是一個不斷增加的數字。

你們來看看下面的圖,相信會很好理解的:

若是採用手動ack機制,實際上倉儲服務每次消費了一條消息,處理完畢完成調度發貨以後,就會發送一個ack消息給RabbitMQ服務器,這個ack消息是會帶上本身本次消息的delivery tag的。

我們看看下面的ack代碼,是否是帶上了一個delivery tag?

channel.basicAck(
        delivery.getEnvelope().getDeliveryTag(), 
        false);
複製代碼

而後,RabbitMQ根據哪一個channel的哪一個delivery tag,不就能夠惟必定位一次消息投遞了?

接下來就能夠對那條消息刪除,標識爲已經處理完畢。

這裏你們必須注意的一點,就是delivery tag僅僅在一個channel內部是惟一標識消息投遞的。

因此說,你ack一條消息的時候,必須是經過接受這條消息的同一個channel來進行。

你們看看下面的圖,直觀的感覺一下。

其實這裏還有一個很重要的點,就是咱們能夠設置一個參數,而後就批量的發送ack消息給RabbitMQ,這樣能夠提高總體的性能和吞吐量。

好比下面那行代碼,把第二個參數設置爲true就能夠了。

channel.basicAck(
            delivery.getEnvelope().getDeliveryTag(), 
            true);
複製代碼

看到這裏,你們應該對這個ack機制的底層原理有了稍微進一步的認識了。起碼是知道delivery tag是啥東西了,他是實現ack的一個底層機制。

而後,咱們再來簡單回顧一下自動ack、手動ack的區別。

實際上默認用自動ack,是很是簡單的。RabbitMQ只要投遞一個消息出去給倉儲服務,那麼他立馬就把這個消息給標記爲刪除,由於他是無論倉儲服務到底接收到沒有,處理完沒有的。

因此這種狀況下,性能很好,可是數據容易丟失。

若是手動ack,那麼就是必須等倉儲服務完成商品調度發貨之後,纔會手動發送ack給RabbitMQ,此時RabbitMQ纔會認爲消息處理完畢,而後纔會標記消息爲刪除。

這樣在發送ack以前,倉儲服務宕機,RabbitMQ會重發消息給另一個倉儲服務實例,保證數據不丟。

四、RabbitMQ如何感知到倉儲服務實例宕機

以前就有同窗提出過這個問題,可是其實要搞清楚這個問題,其實不須要深刻的探索底層,只要本身大體的思考和推測一下就能夠了。

若是你的倉儲服務實例接收到了消息,可是沒有來得及調度發貨,沒有發送ack,此時他宕機了。

咱們想想就知道,RabbitMQ以前既然收到了倉儲服務實例的註冊,所以他們之間必然是創建有某種聯繫的。

一旦某個倉儲服務實例宕機,那麼RabbitMQ就必然會感知到他的宕機,並且對發送給他的還沒ack的消息,都發送給其餘倉儲服務實例。

因此這個問題之後有機會咱們能夠深刻聊一聊,在這裏,你們其實先創建起來這種認識便可。

咱們再回頭看看下面的架構圖:

五、倉儲服務處理失敗時的消息重發

首先,咱們來看看下面一段代碼:

假如說某個倉儲服務實例處理某個消息失敗了,此時會進入catch代碼塊,那麼此時咱們怎麼辦呢?難道仍是直接ack消息嗎?

固然不是了,你要是仍是ack,那會致使消息被刪除,可是實際沒有完成調度發貨。

這樣的話,數據不是仍是丟失了嗎?所以,合理的方式是使用nack操做。

就是通知RabbitMQ本身沒處理成功消息,而後讓RabbitMQ將這個消息再次投遞給其餘的倉儲服務實例嘗試去完成調度發貨的任務。

咱們只要在catch代碼塊里加入下面的代碼便可:

channel.basicNack(
            delivery.getEnvelope().getDeliveryTag(), 
            true);
複製代碼

注意上面第二個參數是true,意思就是讓RabbitMQ把這條消息從新投遞給其餘的倉儲服務實例,由於本身沒處理成功。

你要是設置爲false的話,就會致使RabbitMQ知道你處理失敗,可是仍是刪除這條消息,這是不對的。

一樣,咱們仍是來一張圖,你們一塊兒來感覺一下:

六、階段總結

這篇文章對以前的ack機制作了進一步的分析,包括底層的delivery tag機制,以及消息處理失敗時的消息重發。

經過ack機制、消息重發等這套機制的落地實現,就能夠保證一個消費者服務自身忽然宕機、消息處理失敗等場景下,都不會丟失數據。

End

若有收穫,請幫忙轉發,您的鼓勵是做者最大的動力,謝謝!

一大波微服務、分佈式、高併發、高可用的原創系列文章正在路上

歡迎掃描下方二維碼,持續關注:

石杉的架構筆記(id:shishan100)

十餘年BAT架構經驗傾囊相授

推薦閱讀:

一、拜託!面試請不要再問我Spring Cloud底層原理

二、【雙11狂歡的背後】微服務註冊中心如何承載大型系統的千萬級訪問?

三、【性能優化之道】每秒上萬併發下的Spring Cloud參數優化實戰

四、微服務架構如何保障雙11狂歡下的99.99%高可用

五、兄弟,用大白話告訴你小白都能聽懂的Hadoop架構原理

六、大規模集羣下Hadoop NameNode如何承載每秒上千次的高併發訪問

七、【性能優化的祕密】Hadoop如何將TB級大文件的上傳性能優化上百倍

八、拜託,面試請不要再問我TCC分佈式事務的實現原理!

九、【坑爹呀!】最終一致性分佈式事務如何保障實際生產中99.99%高可用?

十、拜託,面試請不要再問我Redis分佈式鎖的實現原理!

十一、【眼前一亮!】看Hadoop底層算法如何優雅的將大規模集羣性能提高10倍以上?

十二、億級流量系統架構之如何支撐百億級數據的存儲與計算

1三、億級流量系統架構之如何設計高容錯分佈式計算系統

1四、億級流量系統架構之如何設計承載百億流量的高性能架構

1五、億級流量系統架構之如何設計每秒十萬查詢的高併發架構

1六、億級流量系統架構之如何設計全鏈路99.99%高可用架構

1七、七張圖完全講清楚ZooKeeper分佈式鎖的實現原理

1八、大白話聊聊Java併發面試問題之volatile究竟是什麼?

1九、大白話聊聊Java併發面試問題之Java 8如何優化CAS性能?

20、大白話聊聊Java併發面試問題之談談你對AQS的理解?

2一、大白話聊聊Java併發面試問題之公平鎖與非公平鎖是啥?

2二、大白話聊聊Java併發面試問題之微服務註冊中心的讀寫鎖優化

2三、互聯網公司的面試官是如何360°無死角考察候選人的?(上篇)

2四、互聯網公司面試官是如何360°無死角考察候選人的?(下篇)

2五、Java進階面試系列之一:哥們,大家的系統架構中爲何要引入消息中間件?

2六、【Java進階面試系列之二】:哥們,那你說說系統架構引入消息中間件有什麼缺點?

2七、【行走的Offer收割機】記一位朋友斬獲BAT技術專家Offer的面試經歷

2八、【Java進階面試系列之三】哥們,消息中間件在大家項目裏是如何落地的?

2九、【Java進階面試系列之四】扎心!線上服務宕機時,如何保證數據100%不丟失?

30、一次JVM FullGC的背後,竟隱藏着驚心動魄的線上生產事故!

3一、【高併發優化實踐】10倍請求壓力來襲,你的系統會被擊垮嗎?

3二、【Java進階面試系列之五】消息中間件集羣崩潰,如何保證百萬生產數據不丟失?

3三、億級流量系統架構之如何在上萬併發場景下設計可擴展架構(上)?

3四、億級流量系統架構之如何在上萬併發場景下設計可擴展架構(中)?

3五、億級流量系統架構之如何在上萬併發場景下設計可擴展架構(下)?

3六、億級流量架構第二彈:你的系統真的無懈可擊嗎?

3七、億級流量系統架構之如何保證百億流量下的數據一致性(上)

3八、億級流量系統架構之如何保證百億流量下的數據一致性(中)?

3九、億級流量系統架構之如何保證百億流量下的數據一致性(下)?

40、互聯網面試必殺:如何保證消息中間件全鏈路數據100%不丟失(1)

做者:石杉的架構筆記 連接:juejin.im/post/5c263a… 來源:掘金 著做權歸做者全部,轉載請聯繫做者得到受權!

相關文章
相關標籤/搜索