【字符編碼系列】MD5與SHA-1

寫在前面的話

本文屬於 字符編碼系列文章之一,更多請前往 字符編碼系列html

本文中大量資料都是參考或直接複用的來源連接中的,整理本文更多的是梳理本身的知識體系,以及便於後續回顧。git

TODO: 後續還須要對整個MD5以及SHA-1算法從新梳理github

大綱

  • MD5簡介
  • SHA-1簡介
  • MD5 與SHA-1 的比較
  • MD5 與SHA-1 的算法簡述
  • 源碼實現

MD5簡介

MD5即Message-Digest Algorithm 5(信息-摘要算法5),用於確保信息傳輸完整一致。是計算機普遍使用的雜湊算法之一(又譯摘要算法、哈希算法)。算法

主流編程語言廣泛已有MD5實現。將數據(如漢字)運算爲另外一固定長度值,是雜湊算法的基礎原理,MD5的前身有MD二、MD3和MD4。編程

MD5的特色

  • 不可逆: 不能夠從消息摘要中復原信息
  • 壓縮性:任意長度的數據,算出的MD5值的長度都是固定的(128 bit)
  • 抗修改性:對原數據進行任何改動,修改一個字節生成的MD5值區別也會很大
  • 強抗碰撞:已知原數據和MD5,想找到一個具備相同MD5值的數據(即僞造數據)是很是困難的。
  • 容易計算:從原數據計算出MD5值很容易

MD5的做用

MD5的做用是讓大容量信息在用數字簽名軟件簽署私人密鑰前被"壓縮"成一種保密的格式(就是把一個任意長度的字節串變換成必定長的十六進制數字串)。segmentfault

MD5原理簡述

MD5以512位分組來處理輸入的信息,且每一分組又被劃分爲16個32位子分組,通過了一系列的處理後,算法的輸出由四個32位分組組成,將這四個32位分組級聯後將生成一個128位散列值緩存

SHA-1簡介

SHA是美國國家安全局設計的,由美國國家標準和技術研究院發佈的一系列密碼散列函數。安全

最初載明的算法於1993年發佈,稱作安全散列標準 (Secure Hash Standard),FIPS PUB 180。這個版本常被稱爲 "SHA-0"。它在發佈以後很快就被NSA撤回,而且以 1995年發佈的修訂版本 FIPS PUB 180-1 (一般稱爲 "SHA-1") 取代。編程語言

SHA-1的特色

  • 不可逆: 不能夠從消息摘要中復原信息
  • 壓縮性:任意長度的數據,算出的SHA-1值的長度都是固定的(160 bit)
  • 抗修改性:對原數據進行任何改動,修改一個字節生成的SHA-1值區別也會很大
  • 更加安全: 相比MD5,SHA-1因爲摘要長度更長了,因此相比來講強行攻擊SHA-1的難度更大(固然,安全都是相對而言的)
  • 計算較慢:因爲SHA-1的循環步驟比MD5多80:64且要處理的緩存大160比特:128比特,SHA-1的運行速度比MD5慢

SHA-1的做用

這個安全哈希算法(Secure Hash Algorithm)主要適用於數字簽名標準(Digital Signature Standard DSS)裏面定義的數字簽名算法(Digital Signature Algorithm DSA)。函數

對於長度小於2^64位的消息,SHA1會產生一個160位的消息摘要。當接收到消息的時候,這個消息摘要能夠用來驗證數據的完整性。在傳輸的過程當中,數據極可能會發生變化,那麼這時候就會產生不一樣的消息摘要。

SHA-1原理簡述

在SHA1算法中,咱們必須把原始消息(字符串,文件等)轉換成位字符串。SHA1算法只接受位做爲輸入。假設咱們對字符串「abc」產生消息摘要。首先,咱們將它轉換成位字符串以下:01100001 01100010 01100011 ‘a’=97 ‘b’=98 ‘c’=99 這個位字符串的長度爲24

MD5 與SHA-1 的比較

因爲MD5 與SHA-1均是從MD4 發展而來,它們的結構和強度等特性有不少類似之處,下表是對MD5 與SHA-1 的結構比較。

SHA-1與MD5 的最大區別在於其摘要比MD5 摘要長 32 比特。對於強行攻擊,產生任何一個報文使之摘要等於給定報文摘要的難度:

  • MD5 是2128 數量級的操做
  • SHA-1 是2160 數量級的操做。

產生具備相同摘要的兩個報文的難度:

  • MD5是 264 是數量級的操做
  • SHA-1 是280 數量級的操做

於是,SHA-1 對強行攻擊的強度更大。但因爲SHA-1 的循環步驟比MD5 多(80:64)且要處理的緩存大(160 比特:128 比特),SHA-1 的運行速度比MD5 慢。

MD5 SHA-1
分組長度 512 bit 512 bit
摘要長度 128 bit 160 bit
循環中的步驟 64 80
報文最大長度 無窮大 2^64 - 1
基本邏輯函數 4 4
結構形式 Little-endian(小端序) Big-endian(大端序)

MD5 與SHA-1 的算法簡述

SHA1和MD5的算法都是從MD4算法改進而來的2種算法。

基本思路都是將信息分紅N個分組,每組64個字節,每一個分組都進行摘要運算。當一個分組的摘要運算完畢後,將上一個分組的結果也用於下一個分組的運算。

信息的長度(注意是bit位長度,不是字節長度)用64位表示,也要參加信息摘要運算,並且是放在最後一個分組的末尾,因此長度信息要佔據8個字節。

若是信息數據最後一個分組長度小於64個字節,在後面添加0x80標誌結束,若是此時數據+結束標誌已經<=56個字節,還能夠放入長度數據,就在結束標誌到第56個字節補0,而後放入長度,若是此時信息數據+結束標誌已經大於56字節,那麼這個分組後面補0,進行一次摘要運算,而後再創建一個分組,前面所有補0,最後16個字節放長度,再進行一次摘要。

須要注意的地方以下。

  • MD5最後生成的摘要信息是16個字節,SHA1是20個字節。
  • MD5和SHA1的分組信息運算,分組裏面的的數據都會被視爲16個DWORD
  • 而MD5算法認爲這些DWORD的字節序列是LITTLE-ENDIAN(小端序)
  • 而SHA1的算法認爲DWORD是BIG-ENDIAN(大端序)。
  • 因此在不一樣字節序的主機上要進行轉換。放入最後一個分組的長度信息,是原始數據長度,並且是BIT位長度。

源碼實現

如下這個JS試下的SHA-1方式基本就是來源於參考連接中的。

(function(exports) {
    "use strict";
    /**
     * 決定hex是大寫散列仍是小寫散列
     * 爲true爲大寫
     */
    var hexcase = 0;
    var b64pad = "";
    var chrsz = 8;
    /**
     * @description hex_sha1加密,據傳是最安全的散列方法,不可逆
     * @param {String} s 加密內容
     * @return {String} 返回密文,hex字符串
     */
    exports.sha1_hex = function(s) {
        return binb2hex(core_sha1(str2binb(s), s.length * chrsz))
    };
    /**
     * @description b64_sha1加密,也是sha1加密的一種,不可逆
     * @param {String} s 加密內容
     * @return {String} 返回密文,base64字符串
     */
    exports.sha1_b64 = function(s) {
        return binb2b64(core_sha1(str2binb(s), s.length * chrsz))
    };
    /**
     * @description 普通字符串加密,也是sha1加密的一種,不可逆
     * @param {String} s 加密內容
     * @return {String} 返回密文,string字符串
     */
    exports.sha1_str = function(s) {
        return binb2str(core_sha1(str2binb(s), s.length * chrsz))
    };

    function hex_hmac_sha1(key, data) {
        return binb2hex(core_hmac_sha1(key, data))
    }

    function b64_hmac_sha1(key, data) {
        return binb2b64(core_hmac_sha1(key, data))
    }

    function str_hmac_sha1(key, data) {
        return binb2str(core_hmac_sha1(key, data))
    }

    function core_sha1(x, len) {
        x[len >> 5] |= 0x80 << (24 - len % 32);
        x[((len + 64 >> 9) << 4) + 15] = len;
        var w = Array(80);
        var a = 1732584193;
        var b = -271733879;
        var c = -1732584194;
        var d = 271733878;
        var e = -1009589776;
        for(var i = 0; i < x.length; i += 16) {
            var olda = a;
            var oldb = b;
            var oldc = c;
            var oldd = d;
            var olde = e;
            for(var j = 0; j < 80; j++) {
                if(j < 16) w[j] = x[i + j];
                else w[j] = rol(w[j - 3] ^ w[j - 8] ^ w[j - 14] ^ w[j - 16], 1);
                var t = safe_add(safe_add(rol(a, 5), sha1_ft(j, b, c, d)), safe_add(safe_add(e, w[j]), sha1_kt(j)));
                e = d;
                d = c;
                c = rol(b, 30);
                b = a;
                a = t
            }
            a = safe_add(a, olda);
            b = safe_add(b, oldb);
            c = safe_add(c, oldc);
            d = safe_add(d, oldd);
            e = safe_add(e, olde)
        }
        return Array(a, b, c, d, e)
    }

    function sha1_ft(t, b, c, d) {
        if(t < 20) return(b & c) | ((~b) & d);
        if(t < 40) return b ^ c ^ d;
        if(t < 60) return(b & c) | (b & d) | (c & d);
        return b ^ c ^ d
    }

    function sha1_kt(t) {
        return(t < 20) ? 1518500249 : (t < 40) ? 1859775393 : (t < 60) ? -1894007588 : -899497514
    }

    function core_hmac_sha1(key, data) {
        var bkey = str2binb(key);
        if(bkey.length > 16) bkey = core_sha1(bkey, key.length * chrsz);
        var ipad = Array(16),
            opad = Array(16);
        for(var i = 0; i < 16; i++) {
            ipad[i] = bkey[i] ^ 0x36363636;
            opad[i] = bkey[i] ^ 0x5C5C5C5C
        }
        var hash = core_sha1(ipad.concat(str2binb(data)), 512 + data.length * chrsz);
        return core_sha1(opad.concat(hash), 512 + 160)
    }

    function safe_add(x, y) {
        var lsw = (x & 0xFFFF) + (y & 0xFFFF);
        var msw = (x >> 16) + (y >> 16) + (lsw >> 16);
        return(msw << 16) | (lsw & 0xFFFF)
    }

    function rol(num, cnt) {
        return(num << cnt) | (num >>> (32 - cnt))
    }

    function str2binb(str) {
        var bin = Array();
        var mask = (1 << chrsz) - 1;
        for(var i = 0; i < str.length * chrsz; i += chrsz) bin[i >> 5] |= (str.charCodeAt(i / chrsz) & mask) << (32 - chrsz - i % 32);
        return bin
    }

    function binb2str(bin) {
        var str = "";
        var mask = (1 << chrsz) - 1;
        for(var i = 0; i < bin.length * 32; i += chrsz) str += String.fromCharCode((bin[i >> 5] >>> (32 - chrsz - i % 32)) & mask);
        return str
    }

    function binb2hex(binarray) {
        var hex_tab = hexcase ? "0123456789ABCDEF" : "0123456789abcdef";
        var str = "";
        for(var i = 0; i < binarray.length * 4; i++) {
            str += hex_tab.charAt((binarray[i >> 2] >> ((3 - i % 4) * 8 + 4)) & 0xF) + hex_tab.charAt((binarray[i >> 2] >> ((3 - i % 4) * 8)) & 0xF)
        }
        return str
    }

    function binb2b64(binarray) {
        var tab = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
        var str = "";
        for(var i = 0; i < binarray.length * 4; i += 3) {
            var triplet = (((binarray[i >> 2] >> 8 * (3 - i % 4)) & 0xFF) << 16) | (((binarray[i + 1 >> 2] >> 8 * (3 - (i + 1) % 4)) & 0xFF) << 8) | ((binarray[i + 2 >> 2] >> 8 * (3 - (i + 2) % 4)) & 0xFF);
            for(var j = 0; j < 4; j++) {
                if(i * 8 + j * 6 > binarray.length * 32) str += b64pad;
                else str += tab.charAt((triplet >> 6 * (3 - j)) & 0x3F)
            }
        }
        return str
    }
    
    // 能夠將exports暴露成本身的命名空間
    Util.namespace('md5', exports);

})({});

源碼

詳細能夠參考源碼: https://github.com/dailc/charset-encoding-series

附錄

博客

初次發佈2017.06.17於我的博客

http://www.dailichun.com/2017/06/17/md5AndSha1.html

參考資料

相關文章
相關標籤/搜索