在業務系統中不少場景下須要生成不重複的 ID,好比訂單編號、支付流水單號、優惠券編號等都須要使用到。本文將介紹分佈式 ID 的產生緣由,以及目前業界經常使用的四種分佈式 ID 實現方案,而且詳細介紹其中兩種的實現以及優缺點,但願能夠給您帶來關於分佈式 ID 的啓發。node
爲何要用分佈式 ID
隨着業務數據量的增加,存儲在數據庫中的數據愈來愈多,當索引佔用的空間超出可用內存大小後,就會經過磁盤索引來查找數據,這樣就會極大的下降數據查詢速度。如何解決這樣的問題呢?通常咱們首先經過分庫分表來解決,分庫分表後就沒法使用數據庫自增 ID 來做爲數據的惟一編號,那麼就須要使用分佈式 ID 來作惟一編號了。nginx
分佈式 ID 實現方案
目前,關於分佈式 ID ,業界主要有如下四種實現方案:算法
- UUID:使用 JDK 的 UUID#randomUUID() 生成的 ID;
- Redis 的原子自增:使用 Jedis#incr(String key) 生成的 ID;
- Snowflake 算法:以時間戳機器號和毫秒內併發組成的 64 位 Long 型 ID;
- 分段步長:按照步長從數據庫讀取一段可用範圍的 ID;
咱們總結一下這幾種方案的特色:sql
方案 | 順序性 | 重複性 | 可用性 | 部署方式 | 可用時間 |
---|---|---|---|---|---|
UUID | 無序 | 經過多位隨機字符達到極低重複機率,但理論上是會重複的 | 一直可用 | JDK 直接調用 | 永久 |
Redis | 單調遞增 | RDB 持久化模式下,會出現重複 | Redis 宕機後不可用 | Jedis 客戶端調用 | 永久 |
Snowflake | 趨勢遞增 | 不會重複 | 發生時鐘回撥而且回撥時間超過等待閾值時不可用 | 集成部署、集羣部署 | 69年 |
分段步長 | 趨勢遞增 | 不會重複 | 若是數據庫宕機而且獲取步長內的 ID 用完後不可用 | 集成部署、集羣部署 | 永久 |
前面兩種實現方案的用法以及實現你們平常瞭解較多,就不在此贅述...本文咱們會詳細介紹 Snowflake 算法以及分段步長方案。數據庫
Snowflake 算法能夠作到分配好機器號後就可使用,不依賴任何第三方服務實現本地 ID 生成,依賴的第三方服務越少可用性越高,那麼咱們先來介紹一下 Snowflake 算法。編程
Snowflake 算法
長整型數字(即 Long 型數字)的十進制範圍是 -2^64 到 2^64-1。數組
Snowflake 使用的是無符號長整型數字,即從左到右一共 64 位二進制組成,但其第一位是不使用的。因此,在 Snowflake 中使用的是 63bit 的長整型無符號數字,它們由時間戳、機器號、毫秒內併發序列號三個部分組成 :緩存
- 時間戳位:當前毫秒時間戳與新紀元時間戳的差值(所謂新紀元時間戳就是應用開始使用 Snowflake 的時間。若是不設置新紀元時間,時間戳默認是從1970年開始計算的,設置了新紀元時間能夠延長 Snowflake 的可用時間)。41 位 2 進制轉爲十進制是 2^41,除以(365 天 * 24 小時 * 3600 秒 * 1000 毫秒),約等於 69年,因此最多可使用 69 年;
- 機器號:10 位 2 進制轉爲十進制是 2^10,即 1024,也就是說最多能夠支持有 1024 個機器節點;
- 毫秒內併發序列號:12 位 2 進制轉爲十進制是 2^12,即 4096,也就是說一毫秒內在一個機器節點上併發的獲取 ID,最多能夠支持 4096 個併發;
下面咱們來看一下各個分段的使用狀況:服務器
二進制分段 | [1] | [2, 42] | [43, 52] | [53, 64] |
---|---|---|---|---|
說明 | 最高符號位不使用 | 一共41位,是毫秒時間戳位 | 一個10位,是機器號位 | 一共12位,是毫秒內併發序列號,當前請求的時間戳若是和上一次請求的時間戳相同,那麼就將毫秒內併發序列號加一 |
那麼 Snowflake 生成的 ID 長什麼樣子呢?下面咱們來舉幾個例子(假設咱們的時間戳新紀元是 2020-12-31 00:00:00):網絡
時間 | 機器號 | 毫秒併發 | 十進制 Snowflake ID |
---|---|---|---|
2021-01-01 08:33:11 | 1 | 10 | 491031363588106 |
2021-01-02 13:11:12 | 2 | 25 | 923887730696217 |
2021-01-03 21:22:01 | 3 | 1 | 1409793654796289 |
Snowflake 可使用三種不一樣的部署方式來部署,集成分佈式部署方式、中心集羣式部署方式、直連集羣式部署方式。下面咱們來分別介紹一下這幾種部署方式。
Snowflake 集成分佈式部署方式
當使用 ID 的應用節點比較少時,好比 200 個節點之內,適合使用集成分佈式部署方式。每一個應用節點在啓動的時候決定了機器號後,運行時不依賴任何第三方服務,在本地使用時間戳、機器號、以及毫秒內併發序列號生成 ID。
下圖展現的是應用服務器經過引入 jar 包的方式實現獲取分佈式 ID 的過程。每個使用分佈式 ID 的應用服務器節點都會分配一個拓撲網絡內惟一的機器號。這個機器號的管理存放在 MySQL 或者 ZooKeeper 上。
當拓撲網絡內使用分佈式 ID 的機器節點不少,例如超過 1000 個機器節點時,使用集成部署的分佈式 ID 就不合適了,由於機器號位一共是 10 位,即最多支持 1024 個機器號。當機器節點超過 1000 個機器節點時,可使用下面要介紹的中心集羣式部署方式。
Snowflake 中心集羣式部署方式
中心集羣式部署須要新增用來作請求轉發的 ID 網關,好比使用 nginx 反向代理(即下圖中的 ID REST API Gateway)。
使用 ID 網關組網後,應用服務器經過 HTTP 或 RPC 請求 ID 網關獲取分佈式 ID。這樣相比於上面的集成分佈式部署方式,就能夠支撐更多的應用節點使用分佈式 ID 了。
如圖所示,機器號的分配只是分配給下圖中的 ID Generator node 節點,應用節點是不須要分配機器號的。
使用中心集羣式部署方式須要引入新的 nginx 反向代理作網關,增長了系統的複雜性,下降了服務的可用性。那麼咱們下面再介紹一種不須要引入 nginx 又能夠支持超過 1000 個應用節點的直連集羣部署方式。
Snowflake 直連集羣式部署方式
相比於中心集羣部署方式,直連集羣部署方式能夠去掉中間的 ID 網關,提升服務的可用性。
在使用 ID 網關的時候,咱們須要把 ID generator node 的服務地址配置在 ID 網關中。而在使用直連集羣式部署方式時,ID generator node 的服務地址能夠配置在應用服務器本地配置文件中,或者配置在配置中心。應用服務器獲取到服務地址列表後,須要實現服務路由,直連 ID 生成器獲取 ID。
Snowflake 算法存在的問題
Snowflake 算法是強依賴時間戳的算法,若是一旦發生時鐘回撥就會產生 ID 重複的問題。那麼時鐘回撥是怎麼產生的,咱們又須要怎麼去解決這個問題呢?
NTP(Network Time Protocol)服務自動校準可能致使時鐘回撥。咱們身邊的每一臺計算機都有本身本地的時鐘,這個時鐘是根據 CPU 的晶振脈衝計算得來的,然而隨着運行時間的推移,這個時間和世界時間的誤差會愈來愈大,那麼 NTP 就是用來作時鐘校準的服務。
通常狀況下發生時鐘回撥的機率也很是小,由於一旦出現本地時間相對於世界時間須要校準,但時鐘誤差值小於 STEP 閾值(默認128毫秒)時,計算機會選擇以 SLEW 的方式進行同步,即以 0.5 毫秒/秒的速度差調整時鐘速度,保證本地時鐘是一直連續向前的,不產生時鐘回撥,直到本地時鐘和世界時鐘對齊。
然而若是本地時鐘和世界時鐘相差大於 STEP 閾值時,就會發生時鐘回撥。這個 STEP 閾值是能夠修改的,可是修改的越大,在 SLEW 校準的時候須要花費的校準時間就越長,例如 STEP 閾值設置爲 10 分鐘,即本地時鐘與世界時鐘誤差在 10 分鐘之內時都會以 SLEW 的方式進行校準,這樣最多會須要 14 天才會完成校準。
爲了不時鐘回撥致使重複 ID 的問題,可使用 128 毫秒的 STEP 閾值,同時在獲取 SnowflakeID 的時候與上一次的時間戳相比,判斷時鐘回撥是否在 1 秒鐘之內,若是在 1 秒鐘之內,那麼等待 1 秒鐘,不然服務不可用,這樣能夠解決時鐘回撥 1 秒鐘的問題。
分段步長方案
Snowflake 因爲是將時間戳做爲長整形的高位,因此致使生成的最小數字也很是大。好比超過期間新紀元 1 秒鐘,機器號爲 1,毫秒併發序列爲 1 時,生成的 ID 就已經到 4194308097 了。那麼有沒有一種方法可以實如今初始狀態生成數字較小的 ID 呢?答案是確定的,下面來介紹一下分段步長 ID 方案。
使用分段步長來生成 ID 就是將步長和當前最大 ID 存在數據庫中,每次獲取 ID 時更新數據庫中的 ID 最大值增長步長。
數據庫核心表結構以下所示:
CREATE TABLE `segment_id` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `biz_type` varchar(64) NOT NULL DEFAULT '', // 業務類型 `max` bigint(20) DEFAULT '0', // 當前最大 ID 值 `step` bigint(20) DEFAULT '10000', // ID 步長 PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8
在獲取 ID 時,使用開啓事務,利用行鎖保證讀取到當前更新的最大 ID 值:
start transaction; update segment_id set max = max + step where biz_type = 'ORDER'; select max from segment_id where biz_type = 'ORDER'; commit
分段步長 ID 生成方案的優缺點:
- 優勢:ID 生成不依賴時間戳,ID 生成初始值能夠從 0 開始逐漸增長;
- 缺點:當服務重啓時須要將最大 ID 值增長步長,頻繁重啓的話就會浪費掉不少分段。
針對上述兩種實現方案的優化
上文介紹了 Snowflake 算法以及分段步長方案,他們各有優缺點,針對他們各自的狀況咱們在本文也給出相應的優化方案。
ID 緩衝環
爲了提升 SnowflakeID 的併發性能和可用性,可使用 ID 緩衝環(即 ID Buffer Ring)。提升併發性提如今經過使用緩衝環可以充分利用毫秒時間戳,提升可用性提如今能夠相對緩解由時鐘回撥致使的服務不可用。緩衝環是經過定長數組加遊標哈希實現的,相比於鏈表會不須要頻繁的內存分配。
在 ID 緩衝環初始化的時候會請求 ID 生成器將 ID 緩衝環填滿,當業務須要獲取 ID 時,從緩衝環的頭部依次獲取 ID。當 ID 緩衝環中剩餘的 ID 數量少於設定的閾值百分比時,好比剩餘 ID 數量少於整個 ID 緩衝環的 30% 時,觸發異步 ID 填充加載。異步 ID 填充加載會將新生成的 ID 追加到 ID 緩衝環的隊列末尾,而後按照哈希算法映射到 ID 緩衝環上。另外有一個單獨的定時器異步線程來定時填充 ID 緩衝環。
下面的動畫展現了 ID 緩衝環的三個階段:ID 初始化加載、ID 消費、ID 消費後填充:
- Buffer Ring Initialize load,ID 緩衝環初始化加載:從 ID generator 獲取到 ID 填充到 ID 緩衝環,直到 ID 緩衝環被填滿;
- Buffer Ring consume,ID 緩衝環消費:業務應用從 ID 緩衝環獲取 ID;
- Async reload,異步加載填充 ID 緩衝環:定時器線程負責異步的從 ID generator 獲取 ID 添加到 ID 緩衝隊列,同時按照哈希算法映射到 ID 緩衝環上,當 ID 緩衝環被填滿時,異步加載填充結束;
下面的流程圖展現了 ID 緩衝環的運行的整個生命週期,其中:
- IDConsumerServer:表示使用分佈式 ID 的業務系統;
- IDBufferRing:ID 緩衝環;
- IDGenerator:ID 生成器;
- IDBufferRingAsyncLoadThread:異步加載 ID 到緩衝環的線程;
- Timer:負責定時向異步加載線程添加任務來裝載 ID;
- ID 消費流程:即 上面提到的 Buffer Ring consume;
總體流程:客戶端業務請求到應用服務器,應用服務器從 ID 緩衝環獲取 ID,若是 ID 緩衝環內空了那麼拋出服務不可用;若是 ID 緩衝環內存有 ID 那麼就消費一個 ID 。同時在消費 ID 緩衝環中的 ID 時,若是發現 ID 緩衝環中存留的 ID 數量少於整個 ID 緩衝環容量的 30% 時觸發異步加載填充 ID 緩衝環。
ID 雙桶 Buffer
在使用分段步長 ID 時,若是該分段的 ID 用完了,須要更新數據庫分段最大值再繼續提供 ID 生成服務,爲了減小數據庫更新查詢可能帶來的延時對 ID 服務的性能影響,可使用雙桶緩存方案來提升 ID 生成服務的可用性。
其主要原理:設計兩個緩存桶:currentBufferBucket 和 nextBufferBucket,每一個桶都存放一個步長這麼多的 ID,若是當前緩存桶的 ID 用完了,那麼就將下一個緩存桶設置爲當前緩存桶。
下面的動畫展現了雙桶緩存初始化、異步加載預備桶和將預備桶切換成當前桶的全過程:
- Current bucket initial load:初始化當前的緩存桶,即更新 max = max + step,而後獲取更新後的 max 值,好比步長是 1000,更新後的 max 值是 1000,那麼桶的高度就是步長即 1000,桶 min = max - step + 1 = 1,max = 1000;
- Current bucket remaining id count down to 20%,Next bucket start to load。當前緩存桶的 ID 剩餘不足 20% 的時候能夠加載下一個緩存桶,即更新 max = max + step,後獲取更新後的 max 值,此時更新後的 max 值是 2000,min = max - step + 1 = 1001, max = 2000;
- Current bucket is drained,Switch current bucket to the next bucket,若是當前桶的 ID 所有用完了,那麼就將下一個 ID 緩存桶設置爲當前桶;
下面是雙桶 Buffer 的流程圖:
總結
本文主要介紹了分佈式 ID 的實現方案,並詳細介紹了其中 Snowflake 方案和分段步長方案,以及針對這兩種方案的優化方案。咱們再簡單總結一下兩個方案:
- 在高併發場景下生成大量的分佈式 ID,適合使用 Snowflake 算法方案,毫秒內併發序列爲2^12=4096,單機 QPS 支持高達 4 百萬,可是須要對 ID 生成器的機器號進行管理;
- 使用分段步長方式生成 ID 就能夠免去對機器號的管理,可是須要合理的設置步長,若是步長過短知足不了併發需求,若是步長太長又會形成分段的過渡浪費;
以上就是本文的所有內容,若是有更多關於分佈式 ID 的技術也歡迎留言與咱們交流。
做者介紹
古德,網易雲信資深 JAVA 開發工程師。如今負責網易會議帳戶體系、互動直播等模塊的設計與研發。對微服務、分佈式事務等中間件技術方面有必定的經驗。熱愛技術喜歡 Coding,善於面向對象設計編程、領域驅動設計與代碼優化重構。