雪花(snowflake)在天然界中,是極具獨特美麗,又變幻莫測的東西:git
雪花算法的原始版本是scala版,用於生成分佈式ID(純數字,時間順序),訂單編號等。github
自增ID:對於數據敏感場景不宜使用,且不適合於分佈式場景。
GUID:採用無心義字符串,數據量增大時形成訪問過慢,且不宜排序。golang
算法描述:算法
using System; namespace System { /// <summary> /// 分佈式ID算法(雪花算法) /// </summary> public class Snowflake { private static long machineId;//機器ID private static long datacenterId = 0L;//數據ID private static long sequence = 0L;//計數從零開始 private static long twepoch = 687888001020L; //惟一時間隨機量 private static long machineIdBits = 5L; //機器碼字節數 private static long datacenterIdBits = 5L;//數據字節數 public static long maxMachineId = -1L ^ -1L << (int)machineIdBits; //最大機器ID private static long maxDatacenterId = -1L ^ (-1L << (int)datacenterIdBits);//最大數據ID private static long sequenceBits = 12L; //計數器字節數,12個字節用來保存計數碼 private static long machineIdShift = sequenceBits; //機器碼數據左移位數,就是後面計數器佔用的位數 private static long datacenterIdShift = sequenceBits + machineIdBits; private static long timestampLeftShift = sequenceBits + machineIdBits + datacenterIdBits; //時間戳左移動位數就是機器碼+計數器總字節數+數據字節數 public static long sequenceMask = -1L ^ -1L << (int)sequenceBits; //一微秒內能夠產生計數,若是達到該值則等到下一微妙在進行生成 private static long lastTimestamp = -1L;//最後時間戳 private static object syncRoot = new object();//加鎖對象 static Snowflake snowflake; public static Snowflake Instance() { if (snowflake == null) snowflake = new Snowflake(); return snowflake; } public Snowflake() { Snowflakes(0L, -1); } public Snowflake(long machineId) { Snowflakes(machineId, -1); } public Snowflake(long machineId, long datacenterId) { Snowflakes(machineId, datacenterId); } private void Snowflakes(long machineId, long datacenterId) { if (machineId >= 0) { if (machineId > maxMachineId) { throw new Exception("機器碼ID非法"); } Snowflake.machineId = machineId; } if (datacenterId >= 0) { if (datacenterId > maxDatacenterId) { throw new Exception("數據中心ID非法"); } Snowflake.datacenterId = datacenterId; } } /// <summary> /// 生成當前時間戳 /// </summary> /// <returns>毫秒</returns> private static long GetTimestamp() { return (long)(DateTime.UtcNow - new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds; } /// <summary> /// 獲取下一微秒時間戳 /// </summary> /// <param name="lastTimestamp"></param> /// <returns></returns> private static long GetNextTimestamp(long lastTimestamp) { long timestamp = GetTimestamp(); if (timestamp <= lastTimestamp) { timestamp = GetTimestamp(); } return timestamp; } /// <summary> /// 獲取長整型的ID /// </summary> /// <returns></returns> public long GetId() { lock (syncRoot) { long timestamp = GetTimestamp(); if (Snowflake.lastTimestamp == timestamp) { //同一微妙中生成ID sequence = (sequence + 1) & sequenceMask; //用&運算計算該微秒內產生的計數是否已經到達上限 if (sequence == 0) { //一微妙內產生的ID計數已達上限,等待下一微妙 timestamp = GetNextTimestamp(lastTimestamp); } } else { //不一樣微秒生成ID sequence = 0L; } if (timestamp < lastTimestamp) { throw new Exception("時間戳比上一次生成ID時時間戳還小,故異常"); } Snowflake.lastTimestamp = timestamp; //把當前時間戳保存爲最後生成ID的時間戳 long Id = ((timestamp - twepoch) << (int)timestampLeftShift) | (datacenterId << (int)datacenterIdShift) | (machineId << (int)machineIdShift) | sequence; return Id; } } } }
snowflake.goc#
package snowflake // twitter 雪花算法 // 把時間戳,工做機器ID, 序列號組合成一個 64位 int // 第一位置零, [2,42]這41位存放時間戳,[43,52]這10位存放機器id,[53,64]最後12位存放序列號 import "time" var ( machineID int64 // 機器 id 佔10位, 十進制範圍是 [ 0, 1023 ] sn int64 // 序列號佔 12 位,十進制範圍是 [ 0, 4095 ] lastTimeStamp int64 // 上次的時間戳(毫秒級), 1秒=1000毫秒, 1毫秒=1000微秒,1微秒=1000納秒 ) func init() { lastTimeStamp = time.Now().UnixNano() / 1000000 } func SetMachineId(mid int64) { // 把機器 id 左移 12 位,讓出 12 位空間給序列號使用 machineID = mid << 12 } func GetSnowflakeId() int64 { curTimeStamp := time.Now().UnixNano() / 1000000 // 同一毫秒 if curTimeStamp == lastTimeStamp { sn++ // 序列號佔 12 位,十進制範圍是 [ 0, 4095 ] if sn > 4095 { time.Sleep(time.Millisecond) curTimeStamp = time.Now().UnixNano() / 1000000 lastTimeStamp = curTimeStamp sn = 0 } // 取 64 位的二進制數 0000000000 0000000000 0000000000 0001111111111 1111111111 1111111111 1 ( 這裏共 41 個 1 )和時間戳進行並操做 // 並結果( 右數 )第 42 位必然是 0, 低 41 位也就是時間戳的低 41 位 rightBinValue := curTimeStamp & 0x1FFFFFFFFFF // 機器 id 佔用10位空間,序列號佔用12位空間,因此左移 22 位; 通過上面的並操做,左移後的第 1 位,必然是 0 rightBinValue <<= 22 id := rightBinValue | machineID | sn return id } if curTimeStamp > lastTimeStamp { sn = 0 lastTimeStamp = curTimeStamp // 取 64 位的二進制數 0000000000 0000000000 0000000000 0001111111111 1111111111 1111111111 1 ( 這裏共 41 個 1 )和時間戳進行並操做 // 並結果( 右數 )第 42 位必然是 0, 低 41 位也就是時間戳的低 41 位 rightBinValue := curTimeStamp & 0x1FFFFFFFFFF // 機器 id 佔用10位空間,序列號佔用12位空間,因此左移 22 位; 通過上面的並操做,左移後的第 1 位,必然是 0 rightBinValue <<= 22 id := rightBinValue | machineID | sn return id } if curTimeStamp < lastTimeStamp { return 0 } return 0 }
main.goapp
package main import ( "fmt" "reflect" "snowflake" "time" ) func main() { //var ids = []int64{} var ids = make([]int64, 0) //設置一個機器標識,如IP編碼,防止分佈式機器生成重複碼 snowflake.SetMachineId(192168100101) fmt.Println("start", time.Now().Format("13:04:05")) for i := 0; i < 10000000; i++ { id := snowflake.GetSnowflakeId() ids = append(ids, id) } fmt.Println("end ", time.Now().Format("13:04:05")) result := Duplicate(ids) fmt.Println("去重後數量:", len(result)) fmt.Println(result[10], result[11], result[12], result[13], result[14]) fmt.Println(result[9990], result[9991], result[9992], result[9993], result[9994]) } //去重 func Duplicate(a interface{}) (ret []interface{}) { va := reflect.ValueOf(a) for i := 0; i < va.Len(); i++ { if i > 0 && reflect.DeepEqual(va.Index(i-1).Interface(), va.Index(i).Interface()) { continue } ret = append(ret, va.Index(i).Interface()) } return ret }
注意:在分佈式系統中給每臺機器設置一個int64的機器碼,能夠是IP編號+隨機數,如
192168011234
(192.168.0.1
+1234)分佈式
測試結果:
性能
結論:測試
理論上生成速率爲kw/秒,因此徹底知足通常企業級應用, 算法可靠(去重處理在此也是畫蛇添足);
性能:100W+/秒;大數據
參考:
https://blog.csdn.net/u011499747/article/details/78254990