本文屬於 字符編碼系列文章之一,更多請前往 字符編碼系列。html
本文中大量資料都是參考或直接複用的來源連接中的,整理本文更多的是梳理本身的知識體系,以及便於後續回顧。git
TODO: 後續還須要對整個MD5以及SHA-1算法從新梳理github
MD5即Message-Digest Algorithm 5(信息-摘要算法5),用於確保信息傳輸完整一致。是計算機普遍使用的雜湊算法之一(又譯摘要算法、哈希算法)。算法
主流編程語言廣泛已有MD5實現。將數據(如漢字)運算爲另外一固定長度值,是雜湊算法的基礎原理,MD5的前身有MD二、MD3和MD4。編程
MD5的做用是讓大容量信息在用數字簽名軟件簽署私人密鑰前被"壓縮"成一種保密的格式(就是把一個任意長度的字節串變換成必定長的十六進制數字串)。segmentfault
MD5以512位分組來處理輸入的信息,且每一分組又被劃分爲16個32位子分組,通過了一系列的處理後,算法的輸出由四個32位分組組成,將這四個32位分組級聯後將生成一個128位散列值緩存
SHA是美國國家安全局設計的,由美國國家標準和技術研究院發佈的一系列密碼散列函數。安全
最初載明的算法於1993年發佈,稱作安全散列標準 (Secure Hash Standard),FIPS PUB 180。這個版本常被稱爲 "SHA-0"。它在發佈以後很快就被NSA撤回,而且以 1995年發佈的修訂版本 FIPS PUB 180-1 (一般稱爲 "SHA-1") 取代。編程語言
這個安全哈希算法(Secure Hash Algorithm)主要適用於數字簽名標準(Digital Signature Standard DSS)裏面定義的數字簽名算法(Digital Signature Algorithm DSA)。函數
對於長度小於2^64位的消息,SHA1會產生一個160位的消息摘要。當接收到消息的時候,這個消息摘要能夠用來驗證數據的完整性。在傳輸的過程當中,數據極可能會發生變化,那麼這時候就會產生不一樣的消息摘要。
在SHA1算法中,咱們必須把原始消息(字符串,文件等)轉換成位字符串。SHA1算法只接受位做爲輸入。假設咱們對字符串「abc」產生消息摘要。首先,咱們將它轉換成位字符串以下:01100001 01100010 01100011 ‘a’=97 ‘b’=98 ‘c’=99 這個位字符串的長度爲24
因爲MD5 與SHA-1均是從MD4 發展而來,它們的結構和強度等特性有不少類似之處,下表是對MD5 與SHA-1 的結構比較。
SHA-1與MD5 的最大區別在於其摘要比MD5 摘要長 32 比特。對於強行攻擊,產生任何一個報文使之摘要等於給定報文摘要的難度:
產生具備相同摘要的兩個報文的難度:
於是,SHA-1 對強行攻擊的強度更大。但因爲SHA-1 的循環步驟比MD5 多(80:64)且要處理的緩存大(160 比特:128 比特),SHA-1 的運行速度比MD5 慢。
MD5 | SHA-1 | |
---|---|---|
分組長度 | 512 bit | 512 bit |
摘要長度 | 128 bit | 160 bit |
循環中的步驟 | 64 | 80 |
報文最大長度 | 無窮大 | 2^64 - 1 |
基本邏輯函數 | 4 | 4 |
結構形式 | Little-endian(小端序) | Big-endian(大端序) |
SHA1和MD5的算法都是從MD4算法改進而來的2種算法。
基本思路都是將信息分紅N個分組,每組64個字節,每一個分組都進行摘要運算。當一個分組的摘要運算完畢後,將上一個分組的結果也用於下一個分組的運算。
信息的長度(注意是bit位長度,不是字節長度)用64位表示,也要參加信息摘要運算,並且是放在最後一個分組的末尾,因此長度信息要佔據8個字節。
若是信息數據最後一個分組長度小於64個字節,在後面添加0x80標誌結束,若是此時數據+結束標誌已經<=56個字節,還能夠放入長度數據,就在結束標誌到第56個字節補0,而後放入長度,若是此時信息數據+結束標誌已經大於56字節,那麼這個分組後面補0,進行一次摘要運算,而後再創建一個分組,前面所有補0,最後16個字節放長度,再進行一次摘要。
須要注意的地方以下。
如下這個JS試下的SHA-1方式基本就是來源於參考連接中的。
(function(exports) { "use strict"; /** * 決定hex是大寫散列仍是小寫散列 * 爲true爲大寫 */ var hexcase = 0; var b64pad = ""; var chrsz = 8; /** * @description hex_sha1加密,據傳是最安全的散列方法,不可逆 * @param {String} s 加密內容 * @return {String} 返回密文,hex字符串 */ exports.sha1_hex = function(s) { return binb2hex(core_sha1(str2binb(s), s.length * chrsz)) }; /** * @description b64_sha1加密,也是sha1加密的一種,不可逆 * @param {String} s 加密內容 * @return {String} 返回密文,base64字符串 */ exports.sha1_b64 = function(s) { return binb2b64(core_sha1(str2binb(s), s.length * chrsz)) }; /** * @description 普通字符串加密,也是sha1加密的一種,不可逆 * @param {String} s 加密內容 * @return {String} 返回密文,string字符串 */ exports.sha1_str = function(s) { return binb2str(core_sha1(str2binb(s), s.length * chrsz)) }; function hex_hmac_sha1(key, data) { return binb2hex(core_hmac_sha1(key, data)) } function b64_hmac_sha1(key, data) { return binb2b64(core_hmac_sha1(key, data)) } function str_hmac_sha1(key, data) { return binb2str(core_hmac_sha1(key, data)) } function core_sha1(x, len) { x[len >> 5] |= 0x80 << (24 - len % 32); x[((len + 64 >> 9) << 4) + 15] = len; var w = Array(80); var a = 1732584193; var b = -271733879; var c = -1732584194; var d = 271733878; var e = -1009589776; for(var i = 0; i < x.length; i += 16) { var olda = a; var oldb = b; var oldc = c; var oldd = d; var olde = e; for(var j = 0; j < 80; j++) { if(j < 16) w[j] = x[i + j]; else w[j] = rol(w[j - 3] ^ w[j - 8] ^ w[j - 14] ^ w[j - 16], 1); var t = safe_add(safe_add(rol(a, 5), sha1_ft(j, b, c, d)), safe_add(safe_add(e, w[j]), sha1_kt(j))); e = d; d = c; c = rol(b, 30); b = a; a = t } a = safe_add(a, olda); b = safe_add(b, oldb); c = safe_add(c, oldc); d = safe_add(d, oldd); e = safe_add(e, olde) } return Array(a, b, c, d, e) } function sha1_ft(t, b, c, d) { if(t < 20) return(b & c) | ((~b) & d); if(t < 40) return b ^ c ^ d; if(t < 60) return(b & c) | (b & d) | (c & d); return b ^ c ^ d } function sha1_kt(t) { return(t < 20) ? 1518500249 : (t < 40) ? 1859775393 : (t < 60) ? -1894007588 : -899497514 } function core_hmac_sha1(key, data) { var bkey = str2binb(key); if(bkey.length > 16) bkey = core_sha1(bkey, key.length * chrsz); var ipad = Array(16), opad = Array(16); for(var i = 0; i < 16; i++) { ipad[i] = bkey[i] ^ 0x36363636; opad[i] = bkey[i] ^ 0x5C5C5C5C } var hash = core_sha1(ipad.concat(str2binb(data)), 512 + data.length * chrsz); return core_sha1(opad.concat(hash), 512 + 160) } function safe_add(x, y) { var lsw = (x & 0xFFFF) + (y & 0xFFFF); var msw = (x >> 16) + (y >> 16) + (lsw >> 16); return(msw << 16) | (lsw & 0xFFFF) } function rol(num, cnt) { return(num << cnt) | (num >>> (32 - cnt)) } function str2binb(str) { var bin = Array(); var mask = (1 << chrsz) - 1; for(var i = 0; i < str.length * chrsz; i += chrsz) bin[i >> 5] |= (str.charCodeAt(i / chrsz) & mask) << (32 - chrsz - i % 32); return bin } function binb2str(bin) { var str = ""; var mask = (1 << chrsz) - 1; for(var i = 0; i < bin.length * 32; i += chrsz) str += String.fromCharCode((bin[i >> 5] >>> (32 - chrsz - i % 32)) & mask); return str } function binb2hex(binarray) { var hex_tab = hexcase ? "0123456789ABCDEF" : "0123456789abcdef"; var str = ""; for(var i = 0; i < binarray.length * 4; i++) { str += hex_tab.charAt((binarray[i >> 2] >> ((3 - i % 4) * 8 + 4)) & 0xF) + hex_tab.charAt((binarray[i >> 2] >> ((3 - i % 4) * 8)) & 0xF) } return str } function binb2b64(binarray) { var tab = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"; var str = ""; for(var i = 0; i < binarray.length * 4; i += 3) { var triplet = (((binarray[i >> 2] >> 8 * (3 - i % 4)) & 0xFF) << 16) | (((binarray[i + 1 >> 2] >> 8 * (3 - (i + 1) % 4)) & 0xFF) << 8) | ((binarray[i + 2 >> 2] >> 8 * (3 - (i + 2) % 4)) & 0xFF); for(var j = 0; j < 4; j++) { if(i * 8 + j * 6 > binarray.length * 32) str += b64pad; else str += tab.charAt((triplet >> 6 * (3 - j)) & 0x3F) } } return str } // 能夠將exports暴露成本身的命名空間 Util.namespace('md5', exports); })({});
詳細能夠參考源碼: https://github.com/dailc/charset-encoding-series
初次發佈2017.06.17
於我的博客
http://www.dailichun.com/2017/06/17/md5AndSha1.html