微博短連接解析ShortUrl【PHP代碼實現】

      1、背景簡介 html

      短網址應用已經在各大微博上開始流行了起來。例如QQ微博的url.cn,新浪的sinaurl.cn等。咱們在QQ微博上發佈網址的時候,微博會自動判別網址,並將其轉換,例如:http://url.cn/0nAcBW算法

       爲何要這樣作的,緣由我想有這樣幾點:
      一、微博限制字數爲140字一條,那麼若是咱們須要發一些鏈接上去,可是這個鏈接很是的長,以致於將近要佔用咱們內容的一半篇幅,這確定是不能被容許的,因此短網址應運而生了。
      二、短網址能夠在咱們項目裏能夠很好的對開放級URL進行管理。有一部分網址能夠會涵蓋色情,暴力,廣告等信息,這樣咱們能夠經過用戶的舉報,徹底管理這個鏈接將不出如今咱們的應用中,應爲一樣的URL經過加密算法以後,獲得的地址是同樣的。
      三、咱們能夠對一系列的網址進行流量,點擊等統計,挖掘出大多數用戶的關注點,這樣有利於咱們對項目的後續工做更好的做出決策。 數據庫

      2、如何實現 加密

      下面先來看看短網址映射算法的理論(網上找到的資料)
      1)將長網址md5生成32位簽名串,分爲4段, 每段8個字節;
      2)對這四段循環處理, 取8個字節, 將他當作16進制串與0x3fffffff(30位1)與操做, 即超過30位的忽略處理;
      3)這30位分紅6段, 每5位的數字做爲字母表的索引取得特定字符, 依次進行得到6位字符串;
      4)總的md5串能夠得到4個6位串; 取裏面的任意一個就可做爲這個長url的短url地址;
      下面是PHP代碼:
      function shorturl($input) {       
            $base32 = array ('a', 'b', 'c', 'd', 'e', 'f', 'g', 'h','i', 'j', 'k', 'l', 'm', 'n', 'o', 'p','q', 'r', 's', 't', 'u', 'v', 'w', 'x','y', 'z', '0', '1', '2', '3', '4', '5'); 
url

            $hex = md5('prefix'.$input.'surfix');      
            $hexLen = strlen($hex);        
            $subHexLen = $hexLen / 8;       
            $output = array();         
            for ($i = 0; $i < $subHexLen; $i++) {                
                  $subHex = substr ($hex, $i * 8, 8);                
                  $int = 0x3FFFFFFF & (1 * ('0x'.$subHex));               
                  $out = '';                
                  for ($j = 0; $j < 6; $j++) {                       
                        $val = 0x0000001F & $int;                        
                        $out .= $base32[$val];                        
                        $int = $int >> 5;                
                  }               
                  $output = $out;       
            }       
            return $output;
      }
spa

      3、輸出結果
      執行下面代碼的結果以下,會產生4 組6 位字符串,任意一組均可以做爲當前字符串的短連接地址。
      print_r (shorturl(‘http://www.i5good.com/shorturl.html’));
      結果:
      nibgx3 htm

      4、跳轉原理
      當咱們生成短連接以後,只須要在表中(數據庫或者NoSql )存儲原始連接與短連接的映射關係便可。當咱們訪問短連接時,只須要從映射關係中找到原始連接,便可跳轉到原始連接。 索引

相關文章
相關標籤/搜索