PHP實現Snowflake生成分佈式惟一ID

Twitter 的 snowflake 在分佈式生成惟一 UUID 應用仍是蠻普遍的,基於 snowflake 的一些變種的算法網上也有很多。使用 snowflake 生成 UUID 不少都是在分佈式場景下使用,我看了下網上有其中有幾篇 PHP 實現的都沒有考慮到線程安全。如今 PHP 有了 Swoole 的鎖和協程的加持,對於咱們開發線程安全和高併發模擬仍是很方便的,這裏用 PHP 結合 Swoole 來學習下實現最簡單的 snowflake(很久沒寫 PHP,感受沒有 IDE 真寫不了 PHP 了)。php

先來看如下 snowflake 的結構:
1543222572214算法

生成的數值是 64 位,分紅 4 個部分:安全

  • 第一個 bit 爲符號位,最高位爲 0 表示正數
  • 第二部分 41 個 bit 用於記錄生成 ID 時候的時間戳,單位爲毫秒,因此該部分表示的數值範圍爲 2^41 - 1(69 年),它是相對於某一時間的偏移量
  • 第三部分的 10 個 bit 表示工做節點的 ID,表示數值範圍爲 2^10 - 1,至關於支持 1024 個節點
  • 第四部分 12 個 bit 表示每一個工做節點沒毫秒生成的循環自增 id,最多能夠生成 2^12 -1 個 id,超出歸零等待下一毫秒從新自增

先貼下代碼:swoole

<?php

class Snowflake
{
    const EPOCH = 1543223810238;    // 起始時間戳,毫秒

    const SEQUENCE_BITS = 12;   //序號部分12位
    const SEQUENCE_MAX = -1 ^ (-1 << self::SEQUENCE_BITS);  // 序號最大值

    const WORKER_BITS = 10; // 節點部分10位
    const WORKER_MAX = -1 ^ (-1 << self::WORKER_BITS);  // 節點最大數值

    const TIME_SHIFT = self::WORKER_BITS + self::SEQUENCE_BITS; // 時間戳部分左偏移量
    const WORKER_SHIFT = self::SEQUENCE_BITS;   // 節點部分左偏移量

    protected $timestamp;   // 上次ID生成時間戳
    protected $workerId;    // 節點ID
    protected $sequence;    // 序號
    protected $lock;        // Swoole 互斥鎖

    public function __construct($workerId)
    {
        if ($workerId < 0 || $workerId > self::WORKER_MAX) {
            trigger_error("Worker ID 超出範圍");
            exit(0);
        }

        $this->timestamp = 0;
        $this->workerId = $workerId;
        $this->sequence = 0;
        $this->lock = new swoole_lock(SWOOLE_MUTEX);
    }

    /**
     * 生成ID
     * @return int
     */
    public function getId()
    {
        $this->lock->lock();    // 這裏必定要記得加鎖
        $now = $this->now();
        if ($this->timestamp == $now) {
            $this->sequence++;

            if ($this->sequence > self::SEQUENCE_MAX) {
                // 當前毫秒內生成的序號已經超出最大範圍,等待下一毫秒從新生成
                while ($now <= $this->timestamp) {
                    $now = $this->now();
                }
            }
        } else {
            $this->sequence = 0;
        }

        $this->timestamp = $now;    // 更新ID生時間戳

        $id = (($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;
        $this->lock->unlock();  //解鎖

        return $id;
    }

    /**
     * 獲取當前毫秒
     * @return string
     */
    public function now()
    {
        return sprintf("%.0f", microtime(true) * 1000);
    }

}

其實邏輯並不複雜,解釋一下代碼中的位運算:併發

-1 ^ (-1 << self::SEQUENCE_BITS)
就是-1的二進制表示爲1的補碼,其實等同於 :
2**self::SEQUENCE_BITS - 1

最後部分左移後或運算:分佈式

(($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;

這裏主要是對除了第一位符號位之外的三個部分進行左移相應的偏移量使其歸位,並經過或運算從新整合成上面 snowflake 的結構,好比咱們用 3 部分 4 位來演示一下該歸併操做:高併發

0000 0000 0010  --左移0位--> 0000 0000 0010
0000 0000 0100  --左移4位--> 0000 0100 0000 --或操做-->1000 0100 0010
0000 0000 1000  --左移8位--> 1000 0000 0000

下面藉助 Swoole 的協程和 channel 來暴力測試一下,看看生成的 ID 是否會出現重複的情況:學習

$snowflake = new Snowflake(1);

$chan = new chan(100000);
$n = 100000;

for ($i = 0; $i < $n; $i++) {
    go(function () use ($snowflake, $chan) {
        $id = $snowflake->getId();
        $chan->push($id);
    });
}

go(function () use ($chan, $n) {
    $arr = [];
    for ($i = 0; $i < $n; $i++) {
        $id = $chan->pop();
        if (in_array($id, $arr)) {
            exit("ID 已存在");
        }
        array_push($arr, $id);
    }
});

$chan->close();

echo "ok";

跑了一下,確實不會出現重複的 ID,對了,我用 Golang 一樣實現了 snowflake 並協程序方式跑了一樣的測試,PHP 的執行時間是大約 12 秒左右,Golang 只須要 1 秒。文章有什麼錯誤還請指正,謝謝。測試

轉載請註明: 轉載自Ryan 是菜鳥 | LNMP 技術棧筆記this

若是以爲本篇文章對您十分有益,何不 打賞一下

謝謝打賞

本文連接地址: PHP 實現 Snowflake 生成分佈式惟一 ID

相關文章
相關標籤/搜索