聊一聊高併發高可用那些事 - Kafka篇

時間 2020-06-08

標籤併發可用那些 kafka 欄目 Kafka 简体版

原文原文鏈接

目錄git

爲何須要消息隊列github

1.異步：一個下單流程，你須要扣積分，扣優惠卷，發短信等，有些耗時又不須要當即處理的事，能夠丟到隊列裏異步處理。服務器

2.削峯：按日常的流量，服務器恰好能夠正常負載。偶爾推出一個優惠活動時，請求量極速上升。因爲服務器 Redis，MySQL 承受能力不同，若是請求所有接收，服務器負載不了會致使宕機。加機器嘛，須要去調整配置，活動結束後用不到了，即麻煩又浪費。這時能夠將請求放到隊列裏，按照服務器的能力去消費。數據結構

3.解耦：一個訂單流程，須要扣積分，優惠券，發短信等調用多個接口，出現問題時很差排查。像發短信有不少地方須要用到，若是哪天修改了短信接口參數，用到的地方都得修改。這時能夠將要發送的內容放到隊列裏，起一個服務去消費，統一發送短信。異步

高吞吐、高可用 MQ 對比分析分佈式

看了幾個招聘網站，提到較多的消息隊列有：RabbitMQ、RocketMQ、Kafka 以及 Redis 的消息隊列和發佈訂閱模式。工具

Redis 隊列是用 List 數據結構模擬的，指定一端 Push，另外一端 Pop，一條消息只能被一個程序所消費。若是要一對多消費的，能夠用 Redis 的發佈訂閱模式。Redis 發佈訂閱是實時消費的，服務端不會保存生產的消息，也不會記錄客戶端消費到哪一條。在消費的時候若是客戶端宕機了，消息就會丟失。這時就須要用到高級的消息隊列，如 RocketMQ、Kafka 等。性能

ZeroMQ 只有點對點模式和 Redis 發佈訂閱模式差很少，若是不是對性能要求極高，我會用其它隊列代替，畢竟關解決開發環境所需的依賴庫就夠折騰的。網站

RabbitMQ 多語言支持比較完善，特性的支持也比較齊全，可是吞吐量相對小些，並且基於 Erlang 語言開發，不利於二次開發和維護。ui

RocketMQ 和 Kafka 性能差很少，基於 Topic 的訂閱模式。RocketMQ 支持分佈式事務，但在集羣下主從不能自動切換，致使了一些小問題。RocketMQ 使用的集羣是 Master-Slave ，在 Master 沒有宕機時，Slave 做爲災備，空閒着機器。而 Kafka 採用的是 Leader-Slave 無狀態集羣，每臺服務器既是 Master 也是 Slave。

Kafka 相關概念

在高可用環境中，Kafka 須要部署多臺，避免 Kafka 宕機後，服務沒法訪問。Kafka集羣中每一臺 Kafka 機器就是一個 Broker。Kafka 主題名稱和 Leader 的選舉等操做須要依賴 ZooKeeper。

一樣地，爲了不 ZooKeeper 宕機致使服務沒法訪問，ZooKeeper 也須要部署多臺。生產者的數據是寫入到 Kafka 的 Leader 節點，Follower 節點的 Kafka 從 Leader 中拉取數據同步。在寫數據時，須要指定一個 Topic，也就是消息的類型。

一個主題下能夠有多個分區，數據存儲在分區下。一個主題下也能夠有多個副本，每個副本都是這個主題的完整數據備份。Producer 生產消息，Consumer 消費消息。在沒給 Consumer 指定 Consumer Group 時會建立一個臨時消費組。Producer 生產的消息只能被同一個 Consumer Group 中的一個 Consumer 消費。

Broker：Kafka 集羣中的每個 Kafka 實例
Zookeeper：選舉 Leader 節點和存儲相關數據
Leader：生產者與消費者只跟 Leader Kafka 交互
Follower：Follower 從 Leader 中同步數據
Topic：主題，至關於發佈的消息所屬類別
Producer：消息的生產者
Consumer：消息的消費者
Partition：分區
Replica：副本
Consumer Group：消費組

分區、副本、消費組

分區

主題的數據會按分區數分散存到分區下，把這些分區數據加起來纔是一個主題的完整的數據。分區數最好是副本數的整數倍，這樣每一個副本分配到的分區數比較均勻。同一個分區寫入是有順序的，若是要保證全局有序，能夠只設置一個分區。

若是分區數小於消費者數，前面的消費者會配到一個分區，後面超過度區數的消費者將無分區可消費，除非前面的消費者宕機了。若是分區數大於消費者數，每一個消費者至少分配到一個分區的數據，一些分配到兩個分區。這時若是有新的消費者加入，會把有兩個分區的調一個分配到新的消費者。

分區數能夠設置成六、12 等數值。好比 6，當消費者只有一個時，這 6 個分區都歸這個消費者，後面再加入一個消費者時，每一個消費者都負責 3 個分區，後面又加入一個消費者時，每一個消費者就負責 2 個分區。每一個消費者分配到的分區數是同樣的，能夠均勻地消費。

副本

主題的副本數即數據備份的個數，若是副本數爲 1 , 即便 Kafka 機器有多個，當該副本所在的機器宕機後，對應的數據將訪問失敗。

集羣模式下建立主題時，若是分區數和副本數都大於 1，主題會將分區 Leader 較均勻的分配在有副本的 Kafka 上。這樣客戶端在消費這個主題時，能夠從多臺機器上的 Kafka 消息數據，實現分佈式消費。

副本數不是越多越好，從節點須要從主節點拉取數據同步，通常設置成和 Kafka 機器數同樣便可。若是隻須要用到高可用的話，能夠採用 N+1 策略，副本數設置爲 2，專門弄一臺 Kafka 來備份數據。而後主題分佈存儲在 "N" 臺 Kafka 上，"+1" 臺 Kafka 保存着完整的主題數據，做爲備用服務。

Replicas 表示在哪些 Kafka 機器上有主題的副本，Isr 表示當前有副本的 Kafka 機器上還存活着的 Kafka 機器。主題分區中所涉及的 Leader Kafka 宕機時，會將宕機 Kafka 涉及的分區分配到其它可用的 Kafka 節點上。以下：

消費組

每個消費組記錄者各個主題分區的消費偏移量，在消費的時候，若是沒有指定消費組，會默認建立一個臨時消費組。生產者生產的消息只能被同一消費組下某個消費者消費。若是想要一條消息能夠被多個消費者消費，能夠加入不一樣的消費組。

偏移量最大值，消息存儲策略

偏移量的最大值

long 類型最大值是(2^63)-1 （爲何要減一呢？第一位是符號位，正的有2^{62，負的有2}62，其中+0 和 -0 是相等的 , 只不過有的語言把0算到負裏面，有的語言把0算到正裏面）。偏移量是一個 long 類型，除去負數，包含０，其最大值爲 2^62。

消息存儲策略

Kafka 配置項提供兩種策略，一種是基於時間：log.retention.hours=168，另外一種是基於大小：log.retention.bytes=1073741824 。符合條件的數據會被標記爲待刪除，Kafka會在恰當的時候才真正刪除。

Zookeeper 上存的 Kafka 相關數據

如何確保消息只被消費一次

前面已經講到，同一主題裏的分區數據，只能被相同消費組裏其中一個消費者消費。當有多個消費者同時消費同一主題時，將這些消費者都加入相同的消費組，這時生產者的消息只能被其中一個消費者消費。

重複消費和數據丟失問題

生產者

生產者發送消息成功後，不等 Kafka 同步完成的確認，繼續發送下一條消息。在發的過程當中若是 Leader Kafka 宕機了，但生產者並不知情，發出去的信息 Kafka 就收不到，致使數據丟失。解決方案是將 Request.Required.Acks 設置爲 -1，表示生產者等全部副本都確認收到後才發送下一條消息。

Request.Required.Acks=0 表示發送消息即完成發送，不等待確認（可靠性低，延遲小，最容易丟失消息）

Request.Required.Acks=1 表示當 Leader 提交同步完成後才發送下一條消息