短網址服務(TinyURL)生成算法

   

      前不久作了一個優惠劵的分享功能,其中一個功能就是生成一個優惠劵分享短連接。生成的短連接要求每一個連接都是惟一的,而且長度儘量短。在網上查了一下相關的思路,發現了一個不錯的算法。這個算法的思路就是用[a-zA-Z0-9]創建一個長度爲62的矩陣,而後把矩陣打亂,再生成一個全局惟一的數字,再把這個數字用矩陣內的元素表示轉換成62進制,生成的連接長度最大才11位。因此短連接的生成關鍵點就變成了如何生成一個全局惟一的數字和實現進制的轉換。java

    一、生成全局惟一的數字

      這本質是一個分佈式ID的問題。若是簡單處理的話能夠借用redis的incr操做這樣每次取到的ID都是單調遞增且惟一的。另一種方式是借用mysql,這裏不是借用mysql的主鍵的auto_incr特性。而是每一臺應用來請求時分配一個範圍好比 s1 [100-200], s2 來請求的時候就分配 [201-301],本質是利用樂觀鎖進行一個cas操做。mysql

     若是不想借助外部去生成ID的話,能夠用UUID算法。UUID長度12個字節組成由,如下幾個部分組成。redis

  • 4個字節表示的Unix timestamp,
  • 3個字節表示的機器的ID
  • 2個字節表示的進程ID
  • 3個字節表示的計數器

    UUID是一類算法的統稱,具體有不一樣的實現。優勢是每臺機器能夠獨立產生ID,理論上保證不會重複,因此自然是分佈式的,缺點是生成的ID太長,不只佔用內存,並且索引查詢效率低。算法

    還有一個叫Twitter Snowflake算法,本質上看起來與UUID有些相似sql

   

 

   總的來講redis,mysql解決方案就比較簡單直接能夠知足大部分的場景,若是要保證高性能和高可用的話UUID和Twitter Snowflake算法就更合適,實現起來相對複雜一些。   app

   

    二、進制轉換

      這個操做就相對簡單了。直接上代碼 ~分佈式

     

/**
 * 短連接生成
 */
public class TinyURL {

    public static final char[] array =
                    {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
                    'q', 'w', 'e', 'r', 't', 'y', 'u', 'i', 'o', 'p', 'a', 's', 'd',
                    'f', 'g', 'h', 'j', 'k', 'l', 'z', 'x', 'c', 'v', 'b', 'n', 'm',
                    'Q', 'W', 'E', 'R', 'T', 'Y', 'U', 'I', 'O', 'P', 'A', 'S', 'D',
                    'F', 'G', 'H', 'J', 'K', 'L', 'Z', 'X', 'C', 'V', 'B', 'N', 'M'};

    public static Map<Character, Integer> charValueMap = new HashMap<Character, Integer>();

    //初始化map
    static {
        for (int i = 0; i < array.length; i++) charValueMap.put(array[i], i);
    }


    public static void main(String[] args) {
        for (int i = 0; i < 100; i++) {
            long number = Long.MAX_VALUE - i;
            String decimalStr = numberConvertToDecimal(number, 62);
            System.out.println(number  + " 轉換成 " + decimalStr);
            long toNumber = decimalConvertToNumber(decimalStr, 62);
            System.out.println(decimalStr + " 轉換成 " + toNumber);
        }
    }


    /**
     * 把數字轉換成相對應的進制,目前支持(2-62)進制
     *
     * @param number
     * @param decimal
     * @return
     */
    public static String numberConvertToDecimal(long number, int decimal) {
        StringBuilder builder = new StringBuilder();
        while (number != 0) {
            builder.append(array[(int) (number - (number / decimal) * decimal)]);
            number /= decimal;
        }
        return builder.reverse().toString();
    }

    /**
     * 把進制字符串轉換成相應的數字
     * @param decimalStr
     * @param decimal
     * @return
     */
    public static long decimalConvertToNumber(String decimalStr, int decimal) {
        long sum = 0;
        long multiple = 1;
        char[] chars = decimalStr.toCharArray();
        for (int i = chars.length - 1; i >= 0; i--) {
            char c = chars[i];
            sum += charValueMap.get(c) * multiple;
            multiple *= decimal;
        }
        return sum;
    }


}

  這裏面有個小優化就是用charValueMap記錄每一個字符對應的數值,這是一個用空間換時間的策略優化,把O(n)的時間降爲O(1)。性能

      另外一般咱們要記錄短網址與長網址的對應的關係,相對於直接存儲短網址的而言,存儲對應的數值ID會更省空間。優化

相關文章
相關標籤/搜索