RabbitMQ 在分佈式系統的應用

時間 2019-12-04

原文原文鏈接

因爲以前作的項目中須要在多個節點之間可靠地通訊，因此廢棄了以前使用的Redis pub/sub（由於集羣有單點問題，且有諸多限制），改用了RabbitMQ。
使用期間獲得很多收穫，也踩了很多坑，因此在此分享下心得。（簡單瞭解下RabbitMQ? 詳見下文：簡介）html

怎麼保證可靠性的？

RabbitMQ提供了幾種特性，犧牲了一點性能代價，提供了可靠性的保證。java

1. 持久化 node

當RabbitMQ退出時，默認會將消息和隊列都清除，因此須要在第一次聲明隊列和發送消息時指定其持久化屬性爲true，這樣RabbitMQ會將隊列、消息和狀態存到RabbitMQ本地的數據庫，重啓後會恢復。 git

java：github

durable=true   
channel.queueDeclare("task_queue", durable, false, false, null); // 隊列  
channel.basicPublish("", "task_queue",
    MessageProperties.PERSISTENT_TEXT_PLAIN,
    message.getBytes()); // 消息

注：當聲明的隊列已經存在時，嘗試從新定義它的durable是不生效的。docker

2. 接收應答 數據庫

客戶端接收消息的模式默認是自動應答，可是經過設置autoAck爲false可讓客戶端主動應答消息。當客戶端拒絕此消息或者未應答便斷開鏈接時，就會使得此消息從新入隊（在版本2.7.0之前是到從新加入到隊尾，2.7.0及之後是保留消息在隊列中的原來位置）。緩存

java：服務器

autoAck = false;
requeue = true;
channel.basicConsume(queue, autoAck, callback);
channel.basicAck();//應答
channel.basicReject(deliveryTag, requeue); // 拒絕
channel.basicRecover(requeue); // 恢復

3. 發送確認 cookie

默認狀況下，發送端不關注發出去的消息是否被消費掉了。可設置channel爲confirm模式，全部發送的消息都會被確認一次，用戶能夠自行根據server發回的確認消息查看狀態。詳細介紹見：confirms

java：

channel.confirmSelect(); // 進入confirm模式
// do publish messages... 每條消息都會被編號，從1開始
channel.getNextPublishSeqNo() // 查看下一條要發送的消息的序號
channel.waitForConfirms(); // 等待全部消息發送並確認

4. 事務

和confirm模式不能同時使用，並且會帶來大量的多餘開銷，致使吞吐量降低不少，故而不推薦。

java：

channel.txSelect();
try {
    // do something...
    channel.txCommit();
} catch (e){
    channel.txRollback();
}

5. <a name="ha" /> 消息隊列的高可用（主備模式）

相比於路由和綁定，能夠視爲是共享於全部的節點的，消息隊列默認只存在於第一次聲明它的節點上，這樣一旦這個節點掛了，這個隊列中未處理的消息就沒有了。

幸虧，RabbitMQ提供了將它備份到其餘節點的機制，任什麼時候候都有一個master負責處理請求，其餘slaves負責備份，當master掛掉，會將最先建立的那個slave提高爲master。

命令：

rabbitmqctl set_policy ha-all "^ha\." '{"ha-mode":"all"}'

設置全部以'ha'開頭的queue在全部節點上擁有備份。詳細語法點這裏，也能夠在界面上配置。

注：因爲exclusive類型的隊列會在client和server鏈接斷開時被刪掉，因此對它設置持久化屬性和備份都是沒有意義的。

6. 順序保證

直接上圖好了：

一些須要注意的地方

1. 集羣配置

一個集羣中多個節點共享一份.erlang.cookie文件；如果沒有啓用RABBITMQ_USE_LONGNAME，須要在每一個節點的hosts文件中指定其餘節點的地址，否則會找不到其餘集羣中的節點。

2. 腦裂（網絡分區）

RabbitMQ集羣對於網絡分區的處理和忍受能力不太好，推薦使用federation或者shovel插件去解決。federation詳見高級->Federation

可是，狀況已經發生了，怎麼去解決呢？放心，仍是有辦法恢復的。

當網絡斷斷續續時，會使得節點之間的通訊斷掉，進而形成集羣被分隔開的狀況。

這樣，每一個小集羣以後便只處理各自本地的鏈接和消息，從而致使數據不一樣步。當從新恢復網絡鏈接時，它們彼此都認爲是對方掛了-_-||，即可以判斷出有網絡分區出現了。可是RabbitMQ默認是忽略掉不處理的，形成兩個節點繼續各自爲政（路由，綁定關係，隊列等能夠獨立地建立刪除，甚至主備隊列也會每一方擁有本身的master）。

能夠更改配置使得鏈接恢復時，會根據配置自動恢復：

ignore：默認，不作任何處理
pause-minority：斷開鏈接時，判斷當前節點是否屬於少數派（節點數少於或者等於一半），若是是，則暫停直到恢復鏈接。
{pause_if_all_down, [nodes], ignore | autoheal}：斷開鏈接時，判斷當前集羣中節點是否有節點在nodes中，若是有，則繼續運行，不然暫停直到恢復鏈接。這種策略下，當恢復鏈接時，可能會有多個分區存活，因此，最後一個參數決定它們怎麼合併。
autoheal：當恢復鏈接時，選擇客戶端鏈接數最多的節點狀態爲主，重啓其餘節點。

配置：集羣配置

3. 屢次ack

客戶端屢次應答同一條消息，會使得該客戶端收不到後續消息。

結合Docker使用

集羣版本的實現：詳見我本身寫的一個例子rabbitmq-server-cluster

消息隊列中間件的比較

RabbitMQ
- 優勢：支持不少協議如：AMQP，XMPP，STMP，STOMP；靈活的路由；成熟穩定的集羣方案；負載均衡；數據持久化等。
- 缺點：速度較慢；比較重量級，安裝須要依賴Erlang環境。
Redis
- 優勢：比較輕量級，易上手
- 缺點：單點問題，功能單一
Kafka：
- 優勢：高吞吐；分佈式；快速持久化；負載均衡；輕量級
- 缺點：極端狀況下會丟消息

最後附一張網上截取的測試結果:

若是有興趣簡單瞭解下RabbitMQ的簡單介紹，能夠繼續往下看～

簡介

幾個重要的概念：

Virtual Host 包含若干個Exchange和Queue，表示一個節點；
Exchange 接受客戶端發送的消息，並根據Binding將消息路由給服務器中的隊列，Exchange分爲direct, fanout, topic三種。
Binding 鏈接Exchange和Queue，包含路由規則。
Queue 消息隊列，存儲還未被消費的消息。
Message Header+Body
Channel 通道，執行AMQP的命令；一個鏈接可建立多個通道以節省資源。

Client

RabbitMQ官方實現了不少熱門語言的客戶端，就不一一列舉啦，以java爲例，直接開始正題：

1. 創建鏈接

ConnectionFactory factory = new ConnectionFactory();
factory.setHost("localhost");

能夠加上斷開重試機制：

factory.setAutomaticRecoveryEnabled(true);
factory.setNetworkRecoveryInterval(10000);

建立鏈接和通道：

Connection connection = factory.newConnection();
Channel channel = connection.createChannel();

2. 一對一：一個生產者，一個消費者

生產者：

channel.queueDeclare(QUEUE_NAME, false, false, false, null);
channel.basicPublish("", QUEUE_NAME, null, message.getBytes());

消費者：

Consumer consumer = new DefaultConsumer(channel) {
  @Override
  public void handleDelivery(String consumerTag, Envelope envelope, AMQP.BasicProperties properties, byte[] body)
      throws IOException {
    String message = new String(body, "UTF-8");
    System.out.println(" [x] Received '" + message + "'");
  }
};
channel.basicConsume(QUEUE_NAME, autoAck, consumer);

3. 一對多：一個生產者，多個消費者

代碼同上，只不過會有多個消費者，消息會輪序發給各個消費者。

若是設置了autoAck=false，那麼能夠實現公平分發（即對於某個特定的消費者，每次最多隻發送指定條數的消息，直到其中一條消息應答後，再發送下一條）。須要在消費者中加上:

int prefetchCount = 1;
channel.basicQos(prefetchCount);

其餘同上。

4. 廣播

生產者：

channel.exchangeDeclare(EXCHANGE_NAME, "fanout");
String queueName = channel.queueDeclare().getQueue();
channel.queueBind(queueName, EXCHANGE_NAME, "");
channel.basicPublish(EXCHANGE_NAME, "", null, message.getBytes());

消費者同上。

5. Routing：指定路由規則

生產者：

String queueName = channel.queueDeclare().getQueue();
channel.queueBind(queueName, EXCHANGE_NAME, routingKey);
channel.basicPublish(EXCHANGE_NAME, routingKey, null, message.getBytes());

消費者同上。

6. Topics：支持通配符的Routing

* 能夠表示一個單詞
# 能夠表示一個或多個單詞

生產者：

channel.exchangeDeclare(EXCHANGE_NAME, "topic");
String queueName = channel.queueDeclare().getQueue();
channel.queueBind(queueName, EXCHANGE_NAME, bindingKey);

消費者同上。

7. RPC

其實就是一對一模式的一種用法：

首先，客戶端發送一條消息到服務端聲明的隊列，消息屬性中包含reply_to和correlation_id

reply_to 是客戶端建立的消息的隊列，用來接收遠程調用結果
correlation_id 是消息的標識，服務端迴應的消息屬性中會帶上以便知道是哪條消息的結果。

而後，服務端接收到消息，處理，並返回一條結果到reply_to隊列中，

最終，客戶端接收到返回消息，繼續向下處理。

Server

支持各大主流操做系統，這裏以Unix爲例介紹下經常使用配置和命令：

安裝：

因爲RabbitMQ是依賴於Erlang的，因此得首先安裝最近版本的Erlang。

單點的安裝比較簡單，下載解壓便可。下載地址

配置：（通常的，用默認的便可）

$RABBITMQ_HOME/etc/rabbitmq/rabbitmq-env.conf: 環境變量默認配置（也可在啓動腳本中設置，且以啓動命令中的配置爲準）。經常使用的有：
- RABBITMQ_NODENAME：節點名稱，默認是rabbit@$HOSTNAME。
- RABBITMQ_NODE_PORT：協議端口號，默認5672。
- RABBITMQ_SERVER_START_ARGS：覆蓋rabbitmq.config中的一些配置。
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq.config: 核心組件，插件，erlang服務等配置，經常使用的有：
- disk_free_limit：隊列持久化等信息都是存到RabbitMQ本地的數據庫中的，默認限制50000000（也就是最多隻讓它使用50M空間啦，不夠能夠上調，也支持空閒空間百分比的配置）。要是超標了，它就罷工了……
- vm_memory_high_watermark：內存使用，默認0.4（最多讓它使用40%的內存，超標罷工）

注：若啓動失敗了，能夠在啓動日誌中查看到具體的錯誤信息。

命令：

$RABBITMQ_HOME/sbin/rabbitmq-server：啓動腳本，會打印出配置文件，插件，集羣等信息；加上-detached爲後臺啓動；
/sbin/rabbitmqctl status：查看啓動狀態
/sbin/rabbitmqctl add_user admin admin：添加新用戶admin，密碼admin；默認只有一個guest用戶，但只限本機訪問。
/sbin/rabbitmqctl set_user_tags admin administrator：將admin設置爲管理員權限
/sbin/rabbitmqctl set_permissions -p / admin ".*" ".*" ".*" 賦予admin全部權限
/sbin/rabbitmqctl stop：關閉

集羣

集羣節點共享全部的狀態和數據，如：用戶、路由、綁定等信息（隊列有點特殊，雖然從全部節點均可達，可是隻存在於第一次聲明它的那個節點上，解決方案：詳見上文：消息隊列的高可用；每一個節點均可以接收鏈接，處理數據。

集羣節點有兩種，disc：默認，信息存在本地數據庫；ram：加入集羣時，添加--ram參數，信息存在內存，可提升性能。

配置：（通常的，用默認的便可。）

$RABBITMQ_HOME/etc/rabbitmq/rabbitmq-env.conf：
- RABBITMQ_USE_LONGNAME：默認false，(默認的，RABBITMQ_NODENAME中@後面的$HOSTNAME是主機名，因此須要集羣中每一個節點的hosts文件包含其餘節點主機名到地址的映射。可是若是設置爲true，就能夠定義RABBITMQ_NODENAME中的$HOSTNAME爲域名了）
- RABBITMQ_DIST_PORT：集羣端口號，默認RABBITMQ_NODE_PORT + 20000
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq.config：
- cluster_nodes：設置後，在啓動時會嘗試自動鏈接加入的節點並組成集羣。
- cluster_partition_handling：詳見上文：網絡分區的處理。

更多詳細的配置見：配置

命令

rabbitmqctl stop_app
rabbitmqctl join_cluster [--ram] nodename@hostname：將當前節點加入到集羣中；默認是以disc節點加入集羣，加上--ram爲ram節點。
rabbitmqctl start_app
rabbitmqctl cluster_status：查看集羣狀態

注：若是加入集羣失敗，可先查看

每一個節點的$HOME/.erlang.cookie內容一致；
若是hostname是主機名，那麼此hostname和地址的映射須要加入hosts文件中；
若是使用的是域名，那麼須要設置RABBITMQ_USE_LONGNAME爲true。

注：docker版集羣的見：rabbitmq-server-cluster

高級

AMQP協議簡介

RabbitMQ原生支持AMQP 0-9-1並擴展實現了了一些經常使用的功能：AMQP 0-9-1

包含三層：

模型層: 最高層，提供了客戶端調用的命令，如：queue.declare,basic.ack,consume等。
會話層：將命令從客戶端傳遞給服務器，再將服務器的應答傳遞給客戶端，會話層爲這個傳遞過程提供可靠性、同步機制和錯誤處理。
傳輸層：主要傳輸二進制數據流，提供幀的處理、信道複用、錯誤檢測和數據表示。

注：其餘協議的支持見：RabbitMQ支持的協議

經常使用插件

管理界面（神器）

啓動後，執行rabbitmq-plugins enable rabbitmq_management->
訪問http://localhost:15672->查看節點狀態，隊列信息等等，甚至能夠動態配置消息隊列的主備策略，以下圖：

<a name="federation"/> Federation

啓用Federation插件，使得不一樣集羣的節點之間能夠傳遞消息，從而模擬出相似集羣的效果。這樣能夠有幾點好處：

鬆耦合：聯合在一塊兒的不一樣集羣能夠有各自的用戶，權限等信息，無需一致；此外，這些集羣的RabbitMQ和Erlang的版本能夠不一致。
遠程網絡鏈接友好：因爲通訊是遵循AMQP協議的，故而對斷斷續續的網絡鏈接容忍度高。
自定義：能夠自主選擇哪些組件啓用federation。

幾個概念：

Upstreams: 定義上游節點信息，如：
```
rabbitmqctl set_parameter federation-upstream my-upstream '{"uri":"amqp://server-name","expires":3600000}'
```
定義一個my-upstream
- uri是其上游節點的地址，多個upstream的節點無需在同一集羣中。
- expires表示斷開鏈接3600000ms後其上游節點會緩存消息。
Upstream sets: 多個Upstream的集合；默認有個all，會將全部的Upstream加進去。
Policies: 定義哪些exchanges,queues關聯到哪一個Upstream或者Upstream set，如：
```
rabbitmqctl set_policy --apply-to exchanges federate-me "^amq\." '{"federation-upstream-set":"all"}'
```
將此節點全部以amq.開頭的exchange聯合到上游節點的同名exchange。

注：

因爲下游節點的exchange能夠繼續做爲其餘節點的上游，故可設置成循環，廣播等形式。
經過max_hops參數控制傳遞層數。
模擬集羣，能夠將多個節點兩兩互連，並設置max_hops=1。

rabbitmq-plugins enable rabbitmq_federation

若是啓用了管理界面，能夠添加：

rabbitmq-plugins enable rabbitmq_federation_management

這樣就能夠在界面配置Upstream和Policy了。

注：若是在一個集羣中使用federation，須要該集羣每一個節點都啓用Federation插件

注：更多插件請見：插件

原文做者來自 MaxLeap 團隊_Service&Infra 成員：呂舜
原文連接：https://blog.maxleap.cn/archives/648

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。