微博短連接的生成算法(Java版本)

微博短連接的生成算法(Java 版本) html

最近看到微博的短連接真是很火啊,新浪、騰訊、搜狐等微博網站都加入了短連接的功能。之因此要是使用短連接,主要是由於微博只容許發140 字,若是連接地址太長的話,那麼發送的字數將大大減小。短連接的主要職責就是把原始連接很長的地址壓縮成只有6 個字母的短連接地址,當咱們點擊這6 個字母的連接後,咱們又能夠跳轉到原始連接地址。 算法

開始覺得短連接是按照某種算法把原始連接壓縮爲短連接,再根據算法從短連接反算成原始連接的。後來嘗試了下壓縮算法(gzip 壓縮算法),發現對於url 這種字符串越是壓縮,長度就越長。經過對壓縮算法的一些瞭解,發現靠壓縮算法來實現這個功能不太靠譜。 數據庫

後來在網上找到一個生成算法,該算法主要使用MD5 算法對原始連接進行加密(這裏使用的MD5 加密後的字符串長度爲32 位),而後對加密後的字符串進行處理以獲得短連接的地址。原始的算法是C# 版本的,這裏我把該算法修改爲Java 版本的. 算法的具體代碼以下,代碼中有註釋: 數組

1、  代碼 網站

package com.csdn.shorturl; 加密

public class ShortUrlGenerator { url

 

    /** spa

      * @param args htm

      */ blog

    public static void main(String[] args) {

       // 長鏈接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml

       // 新浪解析後的短連接爲: http://t.cn/h1jGSC

       String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999

       String[] aResult = shortUrl (sLongUrl);

       // 打印出結果

       for ( int i = 0; i < aResult. length ; i++) {

           System. out .println( "[" + i + "]:::" + aResult[i]);

       }

    }

 

    public static String[] shortUrl(String url) {

       // 能夠自定義生成 MD5 加密字符傳前的混合 KEY

       String key = "wuguowei" ;

       // 要使用生成 URL 的字符

       String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" ,

              "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" ,

              "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" ,

              "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" ,

              "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" ,

              "U" , "V" , "W" , "X" , "Y" , "Z"

 

       };

       // 對傳入網址進行 MD5 加密

       String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url);

       String hex = sMD5EncryptResult;

 

       String[] resUrl = new String[4];

       for ( int i = 0; i < 4; i++) {

 

           // 把加密字符按照 8 位一組 16 進制與 0x3FFFFFFF 進行位與運算

           String sTempSubString = hex.substring(i * 8, i * 8 + 8);

 

           // 這裏須要使用 long 型來轉換,由於 Inteper .parseInt() 只能處理 31 , 首位爲符號位 , 若是不用 long ,則會越界

           long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16);

           String outChars = "" ;

           for ( int j = 0; j < 6; j++) {

              // 把獲得的值與 0x0000003D 進行位與運算,取得字符數組 chars 索引

              long index = 0x0000003D & lHexLong;

              // 把取得的字符相加

              outChars += chars[( int ) index];

              // 每次循環按位右移 5

              lHexLong = lHexLong >> 5;

           }

           // 把字符串存入對應索引的輸出數組

           resUrl[i] = outChars;

       }

       return resUrl;

    }

}

 

 

2、  輸出結果

執行上面代碼的結果以下,會產生46 位字符串,任意一組均可以做爲當前字符串的短連接地址。

[0]:::7nUFJn

[1]:::f6Zzy2

[2]:::j6jmQb

[3]:::2eAjea

 

3、  跳轉原理

當咱們生成短連接以後,只須要在表中(數據庫或者NoSql )存儲原始連接與短連接的映射關係便可。當咱們訪問短連接時,只須要從映射關係中找到原始連接,便可跳轉到原始連接。

相關文章
相關標籤/搜索