【轉】到底何時應該用MQ

原文地址:http://zhuanlan.51cto.com/art/201704/536407.htm微信

1、緣起架構

一切脫離業務的架構設計與新技術引入都是耍流氓。異步

引入一個技術以前,首先應該解答的問題是,這個技術解決什麼問題。微服務

就像微服務分層架構以前,應該首先回答,爲何要引入微服務,微服務究竟解決什麼問題(詳見《互聯網架構爲何要作微服務?》)。post

最近分享了幾篇MQ相關的文章:微信支付

很多網友詢問,究竟何時使用MQ,MQ究竟適合什麼場景,故有了此文。優化

2、MQ是幹嗎的架構設計

消息總線(Message Queue),後文稱MQ,是一種跨進程的通訊機制,用於上下游傳遞消息。設計

消息總線(Message Queue)

在互聯網架構中,MQ是一種很是常見的上下游「邏輯解耦+物理解耦」的消息通訊服務。3d

使用了MQ以後,消息發送上游只須要依賴MQ,邏輯上和物理上都不用依賴其餘服務。

3、何時不使用消息總線

何時不使用消息總線

既然MQ是互聯網分層架構中的解耦利器,那全部通信都使用MQ豈不是很好?這是一個嚴重的誤區,調用與被調用的關係,是沒法被MQ取代的。

MQ的不足是:

  • 系統更復雜,多了一個MQ組件
  • 消息傳遞路徑更長,延時會增長
  • 消息可靠性和重複性互爲矛盾,消息不丟不重難以同時保證
  • 上游沒法知道下游的執行結果,這一點是很致命的

舉個栗子:用戶登陸場景,登陸頁面調用passport服務,passport服務的執行結果直接影響登陸結果,此處的「登陸頁面」與「passport服務」就必須使用調用關係,而不能使用MQ通訊。

不管如何,記住這個結論:調用方實時依賴執行結果的業務場景,請使用調用,而不是MQ。

4、何時使用MQ

【典型場景一:數據驅動的任務依賴】

什麼是任務依賴,舉個栗子,互聯網公司常常在凌晨進行一些數據統計任務,這些任務之間有必定的依賴關係,好比:

  • task3須要使用task2的輸出做爲輸入
  • task2須要使用task1的輸出做爲輸入

這樣的話,tast1, task2, task3之間就有任務依賴關係,必須task1先執行,再task2執行,載task3執行。

數據驅動的任務依賴

對於這類需求,常見的實現方式是,使用cron人工排執行時間表:

  • task1,0:00執行,經驗執行時間爲50分鐘
  • task2,1:00執行(爲task1預留10分鐘buffer),經驗執行時間也是50分鐘
  • task3,2:00執行(爲task2預留10分鐘buffer)

這種方法的壞處是:

  • 若是有一個任務執行時間超過了預留buffer的時間,將會獲得錯誤的結果,由於後置任務不清楚前置任務是否執行成功,此時要手動重跑任務,還有可能要調整排班表
  • 總任務的執行時間很長,老是要預留不少buffer,若是前置任務提早完成,後置任務不會提早開始
  • 若是一個任務被多個任務依賴,這個任務將會稱爲關鍵路徑,排班表很難體現依賴關係,容易出錯
  • 若是有一個任務的執行時間要調整,將會有多個任務的執行時間要調整

不管如何,採用「cron排班表」的方法,各任務耦合,誰用過誰痛誰知道(採用此法的請評論留言)

優化方案是,採用MQ解耦:

  • task1準時開始,結束後發一個「task1 done」的消息
  • task2訂閱「task1 done」的消息,收到消息後第一時間啓動執行,結束後發一個「task2 done」的消息
  • task3同理

採用MQ的優勢是:

  • 不須要預留buffer,上游任務執行完,下游任務總會在第一時間被執行
  • 依賴多個任務,被多個任務依賴都很好處理,只須要訂閱相關消息便可
  • 有任務執行時間變化,下游任務都不須要調整執行時間

須要特別說明的是,MQ只用來傳遞上游任務執行完成的消息,並不用於傳遞真正的輸入輸出數據。

【典型場景二:上游不關心執行結果】

上游須要關注執行結果時要用「調用」,上游不關注執行結果時,就可使用MQ了。

舉個栗子,58同城的不少下游須要關注「用戶發佈帖子」這個事件,好比招聘用戶發佈帖子後,招聘業務要獎勵58豆,房產用戶發佈帖子後,房產業務要送2個置頂,二手用戶發佈帖子後,二手業務要修改用戶統計數據。

對於這類需求,常見的實現方式是,使用調用關係:

帖子發佈服務執行完成以後,調用下游招聘業務、房產業務、二手業務,來完成消息的通知,但事實上,這個通知是否正常正確的執行,帖子發佈服務根本不關注。

這種方法的壞處是:

  • 帖子發佈流程的執行時間增長了
  • 下游服務當機,可能致使帖子發佈服務受影響,上下游邏輯+物理依賴嚴重
  • 每當增長一個須要知道「帖子發佈成功」信息的下游,修改代碼的是帖子發佈服務,這一點是最噁心的,屬於架構設計中典型的依賴倒轉,誰用過誰痛誰知道(採用此法的請評論留言)

優化方案是,採用MQ解耦:

  • 帖子發佈成功後,向MQ發一個消息
  • 哪一個下游關注「帖子發佈成功」的消息,主動去MQ訂閱

採用MQ的優勢是:

  • 上游執行時間短
  • 上下游邏輯+物理解耦,除了與MQ有物理鏈接,模塊之間都不相互依賴
  • 新增一個下游消息關注方,上游不須要修改任何代碼

典型場景三:上游關注執行結果,但執行時間很長

有時候上游須要關注執行結果,但執行結果時間很長(典型的是調用離線處理,或者跨公網調用),也常用回調網關+MQ來解耦。

舉個栗子,微信支付,跨公網調用微信的接口,執行時間會比較長,但調用方又很是關注執行結果,此時通常怎麼玩呢?

通常採用「回調網關+MQ」方案來解耦:

  • 調用方直接跨公網調用微信接口
  • 微信返回調用成功,此時並不表明返回成功
  • 微信執行完成後,回調統一網關
  • 網關將返回結果通知MQ
  • 請求方收到結果通知

這裏須要注意的是,不該該由回調網關來調用上游來通知結果,若是是這樣的話,每次新增調用方,回調網關都須要修改代碼,仍然會反向依賴,使用回調網關+MQ的方案,新增任何對微信支付的調用,都不須要修改代碼啦。

5、總結

MQ是一個互聯網架構中常見的解耦利器。

何時不使用MQ?

  • 上游實時關注執行結果

何時使用MQ?

  • 數據驅動的任務依賴
  • 上游不關心多下游執行結果
  • 異步返回執行時間長

【本文爲51CTO專欄做者「58沈劍」原創稿件,轉載請聯繫原做者】

相關文章
相關標籤/搜索