Leaf是美團基礎研發平臺推出的一個分佈式ID生成服務,名字取自德國哲學家、數學家萊布尼茨的一句話:「There are no two identical leaves in the world.」Leaf具有高可靠、低延遲、全局惟一等特色。目前已經普遍應用於美團金融、美團外賣、美團酒旅等多個部門。具體的技術細節,可參考此前美團技術博客的一篇文章:《Leaf美團分佈式ID生成服務》。近日,Leaf項目已經在Github上開源:github.com/Meituan-Dia…,但願能和更多的技術同行一塊兒交流、共建。html
Leaf在設計之初就秉承着幾點要求:mysql
Leaf第一個版本採用了預分發的方式生成ID,便可以在DB之上掛N個Server,每一個Server啓動時,都會去DB拿固定長度的ID List。這樣就作到了徹底基於分佈式的架構,同時由於ID是由內存分發,因此也能夠作到很高效。接下來是數據持久化問題,Leaf每次去DB拿固定長度的ID List,而後把最大的ID持久化下來,也就是並不是每一個ID都作持久化,僅僅持久化一批ID中最大的那一個。這個方式有點像遊戲裏的按期存檔功能,只不過存檔的是將來某個時間下發給用戶的ID,這樣極大地減輕了DB持久化的壓力。git
整個服務的具體處理過程以下:github
用戶經過Round-robin的方式調用Leaf Server的各個服務,因此某一個Client獲取到的ID序列多是:1,1001,2001,2,1002,2002......也多是:1,2,1001,2001,2002,2003,3,4......當某個Leaf Server號段用完以後,下一次請求就會從DB中加載新的號段,這樣保證了每次加載的號段是遞增的。算法
Leaf數據庫中的號段表格式以下:sql
+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field | Type | Null | Key | Default | Extra |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag | varchar(128) | NO | PRI | | |
| max_id | bigint(20) | NO | | 1 | |
| step | int(11) | NO | | NULL | |
| desc | varchar(256) | YES | | NULL | |
| update_time | timestamp | NO | | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+
複製代碼
Leaf Server加載號段的SQL語句以下:數據庫
Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit
複製代碼
總體上,V1版本實現比較簡單,主要是爲了儘快解決業務層DB壓力的問題,而快速迭代出的一個版本。於是在生產環境中,也發現了些問題。好比:緩存
爲了解決這兩個問題,Leaf採用了異步更新的策略,同時經過雙Buffer的方式,保證不管什麼時候DB出現問題,都能有一個Buffer的號段能夠正常對外提供服務,只要DB在一個Buffer的下發的週期內恢復,就不會影響整個Leaf的可用性。架構
這個版本代碼在線上穩定運行了半年左右,Leaf又遇到了新的問題:併發
假設服務QPS爲Q,號段長度爲L,號段更新週期爲T,那麼Q * T = L。最開始L長度是固定的,致使隨着Q的增加,T會愈來愈小。可是Leaf本質的需求是但願T是固定的。那麼若是L能夠和Q正相關的話,T就能夠趨近一個定值了。因此Leaf每次更新號段的時候,根據上一次更新號段的週期T和號段長度step,來決定下一次的號段長度nextStep:
至此,知足了號段消耗穩定趨於某個時間區間的需求。固然,面對瞬時流量幾10、幾百倍的暴增,該種方案仍不能知足能夠容忍數據庫在一段時間不可用、系統仍能穩定運行的需求。由於本質上來說,Leaf雖然在DB層作了些容錯方案,可是號段方式的ID下發,最終仍是須要強依賴DB。
在MySQL這一層,Leaf目前採起了半同步的方式同步數據,經過公司DB中間件Zebra加MHA作的主從切換。將來追求徹底的強一致,會考慮切換到MySQL Group Replication。
現階段因爲公司數據庫強一致的特性還在演進中,Leaf採用了一個臨時方案來保證機房斷網場景下的數據一致性:
針對服務自身的監控,Leaf提供了Web層的內存數據映射界面,能夠實時看到全部號段的下發狀態。好比每一個號段雙buffer的使用狀況,當前ID下發到了哪一個位置等信息均可以在Web界面上查看。
Snowflake,Twitter開源的一種分佈式ID生成算法。基於64位數實現,下圖爲Snowflake算法的ID構成圖。
這樣經過時間+機器號+自增ID的組合來實現了徹底分佈式的ID下發。
在這裏,Leaf提供了Java版本的實現,同時對Zookeeper生成機器號作了弱依賴處理,即便Zookeeper有問題,也不會影響服務。Leaf在第一次從Zookeeper拿取workerID後,會在本機文件系統上緩存一個workerID文件。即便ZooKeeper出現問題,同時剛好機器也在重啓,也能保證服務的正常運行。這樣作到了對第三方組件的弱依賴,必定程度上提升了SLA。
分佈式ID生成的方案有不少種,Leaf開源版本提供了兩種ID的生成方式:
讀者能夠按需選擇適合自身業務場景的ID下發方式。但願美團的方案能給予你們一些幫助,同時也但願各位可以一塊兒交流、共建。
Leaf項目Github地址:github.com/Meituan-Dia… 。
若有任何疑問和問題,歡迎提交至Github issues。