1、背景簡介 html
短網址應用已經在各大微博上開始流行了起來。例如QQ微博的url.cn,新浪的sinaurl.cn等。咱們在QQ微博上發佈網址的時候,微博會自動判別網址,並將其轉換,例如:http://url.cn/0nAcBW。 算法
爲何要這樣作的,緣由我想有這樣幾點:
一、微博限制字數爲140字一條,那麼若是咱們須要發一些鏈接上去,可是這個鏈接很是的長,以致於將近要佔用咱們內容的一半篇幅,這確定是不能被容許的,因此短網址應運而生了。
二、短網址能夠在咱們項目裏能夠很好的對開放級URL進行管理。有一部分網址能夠會涵蓋色情,暴力,廣告等信息,這樣咱們能夠經過用戶的舉報,徹底管理這個鏈接將不出如今咱們的應用中,應爲一樣的URL經過加密算法以後,獲得的地址是同樣的。
三、咱們能夠對一系列的網址進行流量,點擊等統計,挖掘出大多數用戶的關注點,這樣有利於咱們對項目的後續工做更好的做出決策。 數據庫
2、如何實現 加密
下面先來看看短網址映射算法的理論(網上找到的資料)
1)將長網址md5生成32位簽名串,分爲4段, 每段8個字節;
2)對這四段循環處理, 取8個字節, 將他當作16進制串與0x3fffffff(30位1)與操做, 即超過30位的忽略處理;
3)這30位分紅6段, 每5位的數字做爲字母表的索引取得特定字符, 依次進行得到6位字符串;
4)總的md5串能夠得到4個6位串; 取裏面的任意一個就可做爲這個長url的短url地址;
下面是PHP代碼:
function shorturl($input) {
$base32 = array ('a', 'b', 'c', 'd', 'e', 'f', 'g', 'h','i', 'j', 'k', 'l', 'm', 'n', 'o', 'p','q', 'r', 's', 't', 'u', 'v', 'w', 'x','y', 'z', '0', '1', '2', '3', '4', '5'); url
$hex = md5('prefix'.$input.'surfix');
$hexLen = strlen($hex);
$subHexLen = $hexLen / 8;
$output = array();
for ($i = 0; $i < $subHexLen; $i++) {
$subHex = substr ($hex, $i * 8, 8);
$int = 0x3FFFFFFF & (1 * ('0x'.$subHex));
$out = '';
for ($j = 0; $j < 6; $j++) {
$val = 0x0000001F & $int;
$out .= $base32[$val];
$int = $int >> 5;
}
$output = $out;
}
return $output;
} spa
3、輸出結果
執行下面代碼的結果以下,會產生4 組6 位字符串,任意一組均可以做爲當前字符串的短連接地址。
print_r (shorturl(‘http://www.i5good.com/shorturl.html’));
結果:
nibgx3 htm
4、跳轉原理
當咱們生成短連接以後,只須要在表中(數據庫或者NoSql )存儲原始連接與短連接的映射關係便可。當咱們訪問短連接時,只須要從映射關係中找到原始連接,便可跳轉到原始連接。 索引