初識中間件之消息隊列

時間 2019-11-08

標籤中間件消息隊列简体版

原文原文鏈接

初識中間件之消息隊列

1 消息隊列概述

消息隊列是分佈式系統中的重要組件，主要解決應用耦合，異步消息，流量削鋒等問題，以實現高性能，高可用，可伸縮和最終一致性架構，是大型分佈式系統中不可缺乏的中間件。前端

目前使用較多的消息隊列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等，好比我以前用過的RabbitMQ以及kafka。web

2 消息隊列應用場景

在實際應用中，消息隊列經常使用於異步處理、應用解耦、流量削鋒和消息通信這四個場景。算法

2.1 異步處理

用戶註冊後，須要發註冊郵件和註冊短信。傳統的作法有兩種：1.串行；2.並行。數據庫

串行：將註冊信息寫入數據庫成功後，發送註冊郵件，再發送註冊短信。以上三個任務所有完成後，再返回結果給客戶端，如圖所示：編程

並行：將註冊信息寫入數據庫成功後，發送註冊郵件的同時，發送註冊短信。以上三個任務完成後，返回給客戶端。與串行的差異是，並行的方式能夠提升處理的時間，如圖所示：服務器

假設三個業務節點，每一個使用50ms，不考慮網絡等其餘開銷，則串行方式的時間是150ms，並行的時間多是100ms。網絡

由於CPU在單位時間內處理的請求數是必定的，假設CPU1秒內吞吐量是1次，則串行方式1秒內CPU可處理的請求量是7次（1000/150），並行方式處理的請求量是10次（1000/100）。數據結構

小結：如以上案例描述，傳統方式系統的性能（併發量，吞吐量，響應時間）會有瓶頸。如何解決這個問題呢？多線程

引入消息隊列，將不是必須的業務邏輯進行異步處理。改造後的架構以下：架構

註冊郵件和發送短信寫入消息隊列後，直接返回，所以寫入消息隊列的速度很快，基本能夠忽略，預估爲5ms，再加上註冊信息寫入數據庫的時間50ms，整體響應時間就只有55ms。可見架構改變後，系統的TPS提升到了20（1000/55），比串行提升了3倍，比並行提升了2倍。

2.2 應用解耦

用戶下單後，訂單系統須要通知庫存系統。傳統的作法是，訂單系統調用庫存系統的接口，如圖所示：

傳統模式的缺點：

假如庫存系統沒法訪問，則訂單減庫存將失敗，從而致使下單失敗；
訂單系統與庫存系統耦合。

如何解決以上問題呢？引入消息隊列後的方案以下圖所示：

訂單系統：用戶下單後，訂單系統完成持久化處理，將消息寫入消息隊列，返回用戶訂單下單成功；
庫存系統：訂閱下單的消息，採用拉/推的方式，獲取下單信息，庫存系統根據下單信息，進行庫存操做；
假如在下單時庫存系統不能正常使用，也不影響正常下單，由於下單後，訂單系統寫入消息隊列就再也不關心其餘的後續操做了。實現訂單系統與庫存系統的應用解耦。

2.3 流量削鋒

流量削鋒也是消息隊列中的經常使用場景，通常在秒殺或團搶活動中使用普遍。

秒殺活動，可能會由於流量暴增而致使應用掛掉。爲了解決這個問題，通常須要在應用前端加入消息隊列，這樣作的用處有：

能夠控制參加活動的人數；
能夠緩解短期內流量增加的速度，避免壓垮應用；
服務器接收用戶的請求後，首先寫入消息隊列。假如消息隊列長度超過最大數量，則直接拋棄用戶請求或跳轉到錯誤頁面；
秒殺業務根據消息隊列中的請求信息，再作後續處理。

2.4 日誌處理

日誌處理是指將消息隊列用在日誌處理中，好比Kafka的應用，解決大量日誌傳輸的問題。架構簡化以下：

日誌採集客戶端：負責日誌數據採集，定時寫入Kafka隊列；
Kafka消息隊列：負責日誌數據的接收、存儲和轉發；
日誌處理業務：訂閱並消費Kafka隊列中的日誌數據。

如下是新浪的Kafka日誌處理應用案例：

Kafka：接收用戶日誌的消息隊列；
Logstash：作日誌解析，統一成JSON輸出給Elasticsearch；
Elasticsearch：實時日誌分析服務的核心技術，由Schemaless提供實時的數據存儲服務，經過index組織數據，兼具強大的搜索和統計功能；
Kibana：基於Elasticsearch的數據可視化組件，超強的數據可視化能力是衆多公司選擇ELK stack的重要緣由。

2.5 消息通信

消息隊列通常都內置了高效的通訊機制，所以也能夠用於單純的消息通信，好比實現點對點消息隊列或者聊天室等。

點對點通信：

客戶端A和客戶端B使用同一隊列，進行消息通信。

聊天室通信：

客戶端A，客戶端B，客戶端N訂閱同一主題，進行消息發佈和接收，便可實現相似聊天室的效果。

3 消息中間件示例

3.1 電商系統

消息隊列採用高可用，可持久化的消息中間件，好比Active MQ，Rabbit MQ以及Rocket Mq。

應用將主幹邏輯處理完成後，寫入消息隊列。消息發送是否成功能夠開啓消息的確認模式。（消息隊列返回消息接收成功狀態後，應用再返回，這樣保障消息的完整性）；
擴展流程（發短信，進銷存處理）訂閱隊列消息，採用推或拉的方式獲取消息並處理；
消息將應用解耦的同時，帶來了數據一致性問題，能夠採用最終一致性方式解決。好比主數據寫入數據庫，擴展應用根據消息隊列，並結合數據庫方式實現基於消息隊列的後續處理。

3.2日誌收集系統

分爲Zookeeper註冊中心、日誌收集客戶端、Kafka集羣和Storm集羣（OtherApp）四部分組成。

Zookeeper註冊中心，提出負載均衡和地址查找服務；
日誌收集客戶端，用於採集應用系統的日誌，並將數據推送到kafka隊列；
Kafka集羣：接收，路由，存儲，轉發等消息處理；
Storm集羣：與OtherApp處於同一級別，採用拉的方式消費隊列中的數據。

4 JMS消息服務

講消息隊列就不得不提JMS 。JMS（JAVA Message Service,Java消息服務）API是一個消息服務的標準/規範，容許應用程序組件基於JavaEE平臺建立、發送、接收和讀取消息。它使分佈式通訊耦合度更低，消息服務更加可靠以及異步性。

在EJB架構中，有消息Bean能夠無縫地與JM消息服務集成。在J2EE架構模式中，有消息服務者模式，用於實現消息與應用直接的解耦。

4.1消息模型

在JMS標準中，有兩種消息模型P2P（Point to Point）和Publish/Subscribe(Pub/Sub)。

4.1.1 P2P模式

P2P模式包含三個角色：消息隊列（Queue），發送者(Sender)以及接收者(Receiver)。每一個消息都被髮送到一個特定的隊列，接收者從隊列中獲取消息。隊列保留着消息，直到他們被消費或超時。咱們的跨境電商項目目前用的就是這種模式。

P2P的特色：

每一個消息只有一個消費者（Consumer）(即一旦被消費，消息就再也不在消息隊列中)；
發送者和接收者之間在時間上沒有依賴性，也就是說當發送者發送了消息以後，無論接收者有沒有正在運行，它不會影響到消息被髮送到隊列；
接收者在成功接收消息以後需向隊列應答成功。

若是但願發送的每一個消息都會被成功處理的話，那麼須要P2P模式。

4.1.2 Pub/Sub模式

包含三個角色：主題（Topic），發佈者（Publisher）以及訂閱者（Subscriber）。多個發佈者將消息發送到Topic,系統將這些消息傳遞給多個訂閱者。

Pub/Sub的特色：

每一個消息能夠有多個消費者；
發佈者和訂閱者之間有時間上的依賴性。針對某個主題（Topic）的訂閱者，它必須建立一個訂閱者以後，才能消費發佈者的消息；
爲了消費消息，訂閱者必須保持運行的狀態。

爲了緩和這樣嚴格的時間相關性，JMS容許訂閱者建立一個可持久化的訂閱。這樣，即便訂閱者沒有被激活（運行），它也能接收到發佈者的消息。

若是但願發送的消息能夠不被作任何處理、或者只被一個消息者處理、或者能夠被多個消費者處理的話，那麼能夠採用Pub/Sub模型。

4.2 消息消費

在JMS中，消息的產生和消費都是異步的，JMS的消費者能夠經過兩種方式來消費消息。

同步：訂閱者或接收者經過Receive方法來接收消息，Receive方法在接收到消息以前（或超時以前）將一直阻塞；
異步：訂閱者或接收者能夠註冊爲一個消息監聽器，當消息到達以後，系統自動調用監聽器的onMessage方法。

JNDI：Java命名和目錄接口,是一種標準的Java命名系統接口。能夠在網絡上查找和訪問服務。經過指定一個資源名稱，該名稱對應於數據庫或命名服務中的一個記錄，同時返回資源鏈接創建所必須的信息。

JNDI在JMS中起到查找和訪問發送目標或消息來源的做用。

4.3 JMS編程模型

(1) ConnectionFactory

建立Connection對象的工廠，針對兩種不一樣的JMS消息模型，分別有QueueConnectionFactory和TopicConnectionFactory兩種。能夠經過JNDI來查找ConnectionFactory對象。

(2) Destination

Destination的意思是消息生產者的消息發送目標或者說消息消費者的消息來源。對於消息生產者來講，它的Destination是某個隊列（Queue）或某個主題（Topic）;對於消息消費者來講，它的Destination也是某個隊列或主題（即消息來源）。

因此，Destination實際上就是兩種類型的對象：Queue、Topic能夠經過JNDI來查找Destination。

(3) Connection

Connection表示在客戶端和JMS系統之間創建的連接（對TCP/IP Socket的包裝）。Connection能夠產生一個或多個Session。跟ConnectionFactory同樣，Connection也有兩種類型：QueueConnection和TopicConnection。

(4) Session

Session是操做消息的接口。能夠經過Session建立生產者、消費者、消息等。Session提供了事務的功能。當須要使用Session發送/接收多個消息時，能夠將這些發送/接收動做放到一個事務中。一樣，也分QueueSession和TopicSession。

(5) 消息的生產者

消息生產者由Session建立，並用於將消息發送到Destination。一樣，消息生產者分兩種類型：QueueSender和TopicPublisher。能夠調用消息生產者的方法（send或publish方法）發送消息。

(6) 消息消費者

消息消費者由Session建立，用於接收被髮送到Destination的消息。兩種類型：QueueReceiver和TopicSubscriber。可分別經過Session的createReceiver(Queue)或createSubscriber(Topic)來建立。固然，也可使用Session的creatDurableSubscriber方法來建立持久化的訂閱者。

(7) MessageListener

消息監聽器。若是註冊了消息監聽器，一旦消息到達，將自動調用監聽器的onMessage方法。EJB中的MDB（Message-Driven Bean）就是一種MessageListener。

5 經常使用消息隊列

通常商用的容器，好比WebLogic，JBoss，都支持JMS標準，開發上很方便。但免費的好比Tomcat，Jetty等則須要使用第三方的消息中間件。本部份內容介紹經常使用的消息中間件（Rabbit MQ,Rabbit MQ，Zero MQ,Kafka）以及它們的特色。

5.1 RabbitMQ

RabbitMQ是流行的開源消息隊列系統，用erlang語言開發。RabbitMQ是AMQP（高級消息隊列協議）的標準實現，支持多種客戶端，如：Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等，支持AJAX，持久化。用於在分佈式系統中存儲轉發消息，在易用性、擴展性、高可用性等方面表現不俗。咱們的跨境電商項目選用的消息隊列就是RabbitMQ。

結構圖以下：

幾個重要概念：

Broker：簡單來講就是消息隊列服務器實體；
Exchange：消息交換機，它指定消息按什麼規則，路由到哪一個隊列；
Queue：消息隊列載體，每一個消息都會被投入到一個或多個隊列；
Binding：綁定，它的做用就是把Exchange和Queue按照路由規則綁定起來；
Routing Key：路由關鍵字，Exchange根據這個關鍵字進行消息投遞；
Vhost：虛擬主機，一個Broker裏能夠開設多個Vhost，用做不一樣用戶的權限分離；
Producer：消息生產者，就是投遞消息的程序；
Consumer：消息消費者，就是接受消息的程序；
Channel：消息通道，在客戶端的每一個鏈接裏，可創建多個Channel，每一個Channel表明一個會話任務。

消息隊列的使用過程以下：

（1）生產者和消費者鏈接到消息隊列服務器，打開一個Channel；

（2）生產者和消費者聲明一個Exchange，並設置相關屬性；

（3）生產者和消費者聲明一個Queue，並設置相關屬性；

（4）生產者和消費者使用Routing Key，在Exchange和Queue之間創建好綁定關係；

（5）生產者投遞消息到Exchange。Exchange接收到消息後，就根據消息的Key和已經設置的Binding進行消息路由，將消息投遞到一個或多個隊列裏；

（6）消費者從隊列讀取消息進行消費。

5.2 ActiveMQ

ActiveMQ 是Apache出品，最流行的，能力強勁的開源消息總線。ActiveMQ 是一個徹底支持JMS1.1和J2EE 1.4規範的 JMS Provider實現，儘管JMS規範出臺已是好久的事情了，可是JMS在當今的J2EE應用中仍然扮演着特殊的地位。

ActiveMQ特性以下：

多種語言和協議編寫客戶端。語言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協議： OpenWire,Stomp REST,WS Notification,XMPP,AMQP；
徹底支持JMS1.1和J2EE 1.4規範（持久化，XA消息，事務)；
對Spring的支持，ActiveMQ能夠很容易內嵌到使用Spring的系統裏面去，並且也支持Spring2.0的特性；
經過了常見J2EE服務器（如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試，其中經過JCA 1.5 Resource Adaptors的配置，可讓ActiveMQ能夠自動地部署到任何兼容J2EE 1.4 商業服務器上；
支持多種傳送協議：in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA；
支持經過JDBC和Journal提供高速的消息持久化；
從設計上保證了高性能的集羣，客戶端-服務器，點對點；
支持Ajax；
支持與Axis的整合；
能夠很容易地調用內嵌JMS provider，進行測試。

5.3 ZeroMQ

號稱史上最快的消息隊列，它實際相似於Socket的一系列接口，跟Socket的區別是：普通的Socket是端到端的（1:1的關係），而ZeroMQ倒是能夠N：M 的關係，人們對BSD套接字的瞭解較多的是點對點的鏈接，點對點鏈接須要顯式地創建鏈接、銷燬鏈接、選擇協議（TCP/UDP）和處理錯誤等，而ZeroMQ屏蔽了這些細節，讓網絡編程更爲簡單。ZeroMQ用於Node與Node間的通訊，Node能夠是主機或者是進程。

引用官方的說法：「ZeroMQ是一個簡單好用的傳輸層，像框架同樣的一個Socket Library，它使得Socket編程更加簡單、簡潔和高性能。同時也是一個消息處理隊列庫，可在多個線程、內核和主機盒之間彈性伸縮。ZeroMQ的明確目標是「成爲標準網絡協議棧的一部分，以後進入Linux內核」。如今還未看到它們的成功。可是，它無疑是極具前景的、而且是人們更加須要的「傳統」BSD套接字之上的一層封裝。ZeroMQ讓編寫高性能網絡應用程序極爲簡單和有趣。」

特色以下：

高性能，非持久化；
跨平臺：支持Linux、Windows、OS X等；
多語言支持： C、C++、Java、.NET、Python等30多種開發語言；
可單獨部署或集成到應用中使用；
可做爲Socket通訊庫使用。

與RabbitMQ相比，ZeroMQ並不像是一個傳統意義上的消息隊列服務器，事實上，它也根本不是一個服務器，更像一個底層的網絡通信庫，在Socket API之上作了一層封裝，將網絡通信、進程通信和線程通信抽象爲統一的API接口。支持「Request-Reply 「，」Publisher-Subscriber「，」Parallel Pipeline」三種基本模型和擴展模型。

ZeroMQ高性能設計要點：

無鎖的隊列模型：對於跨線程間的交互（用戶端和Session）之間的數據交換通道Pipe，採用無鎖的隊列算法CAS；在Pipe兩端註冊有異步事件，在讀或者寫消息到Pipe的時，會自動觸發讀寫事件；
批量處理的算法：對於傳統的消息處理，每一個消息在發送和接收的時候，都須要系統的調用，這樣對於大量的消息，系統的開銷比較大，zeroMQ對於批量的消息，進行了適應性的優化，能夠批量地接收和發送消息；
多核下的線程綁定，無須CPU切換：區別於傳統的多線程併發模式，信號量或者臨界區，ZeroMQ充分利用多核的優點，每一個核綁定運行一個工做者線程，避免多線程之間的CPU切換開銷。

5.4 Kafka

Kafka是一種高吞吐量的分佈式發佈訂閱消息系統，它能夠處理消費者規模的網站中的全部動做流數據。這種動做（網頁瀏覽，搜索和其餘用戶的行動）是在現代網絡上的許多社會功能的一個關鍵因素。這些數據一般是因爲吞吐量的要求而經過日誌聚合和分析來解決。對於像Hadoop同樣的日誌數據離線分析系統，若是有實時處理的需求，Kafka就是一個可行的解決方案。Kafka的目的是經過Hadoop的並行加載機制來統一線上和離線的消息處理，也是爲了經過集羣機來提供實時的消費。

Kafka是一種高吞吐量的分佈式發佈訂閱消息系統，有以下特性：

經過O(1)的磁盤數據結構提供消息的持久化，這種結構對於即便數以TB的消息存儲也可以保持長時間的穩定性能。（文件追加的方式寫入數據，過時的數據按期刪除）；
高吞吐量：即便是很是普通的硬件Kafka也能夠支持每秒數百萬的消息；
支持經過Kafka服務器和消費機集羣來分區消息；
支持Hadoop並行數據加載。

Kafka相關概念：

Broker：Kafka集羣包含一個或多個服務器，這種服務器被稱爲Broker；
Topic：每條發佈到Kafka集羣的消息都有一個類別，這個類別被稱爲Topic（物理上不一樣Topic的消息分開存儲，邏輯上一個Topic的消息雖然保存於一個或多個Broker上，但用戶只需指定消息的Topic便可生產或消費數據，而沒必要關心數據存於何處）；
Partition：Parition是物理上的概念，每一個Topic包含一個或多個Partition；
Producer：負責發佈消息到Kafka Broker；
Consumer：消息消費者，即向Kafka Broker讀取消息的客戶端；
Consumer Group：每一個Consumer屬於一個特定的Consumer Group（可爲每一個Consumer指定Group Name，若不指定Group Name則屬於默認的Group）。