密碼學基礎（一）：摘要算法

時間 2019-11-16

標籤密碼學基礎摘要算法简体版

原文原文鏈接

什麼是摘要算法

摘要算法是經過一系列的計算方法和規則，將輸入的任意長度的數據轉化成固定長度的返回值，這個值被稱爲hash值(哈希值)，而這種算法被稱爲摘要算法、哈希算法、散列算法。算法

主流的摘要算法

MD四、MD5：MD5生成128位固定長度的hash值，已經被破解；數據庫

SHA-1：生成164位固定長度的hash值，已經被破解；瀏覽器

SHA-2：生成22四、25六、38四、512位的hash值；安全

SHA-3：全新的算法和標準服務器

備註：從MD4-SHA-2，隨着生成的長度的增長，碰撞成功的機率會減少，由於只能暴力枚舉破解，因此破解的難度也就增大。好比128位的MD5，碰撞機率爲2的128次方分之1，而512位則爲2的512次方分之一。app

摘要算法的大概原理

以MD5爲例，MD5以512位對原數據進行分組加密，最後輸出32個16進制，也就是32x4=128位，其加密的基本流程以下：函數

第一步：補位

元數據若是位數不知足Length=512xn+448，也就是512取餘值爲448，則對其補位使其知足規則。其意義是在MD5中，將元數據分爲512位後分組進行加密（後面會講到），其中會預留64位來表示數據的原始信息，好比原始長度等。因此Length=512xn+448，加上64位的預留信息以後：Total=Length+64=512x(n+1)。工具

第二步：設定初始值

摘要算法根據元數據長度按照512分爲n組後，會對初始值進行n輪加密運算，每輪的計算方式和第一輪大同小異。全部輪數計算完畢後將變化後的4個初始值組合輸出最終結果。官方實現中的4個初始值爲： A=0x01234567 B=0x89ABCDEF C=0xFEDCBA98 D=0x76543210 如上所示，A、B、C、D都爲8個16進制，一個16進製表示4位，因此一個初始值的位數就是8x4=32位，因此MD5最終輸出的長度固定爲32x4=128.學習

第三步：按照組數循環計算

算法的大概過程以下，大概就是對ABCD一頓猛如虎的操做演變成徹底不一樣的ABCD，詳細過程再此不深究，具體算法和過程能夠自行百度網站

摘要算法不可逆的緣由 如上圖所示，F爲4個非線性函數中的一個，4個非線性函數都是由位運算構成，Mi爲第一步中補位後的原文分紅16等分，Ki爲常量，i的範圍爲0-15，Ki每次都不同。其後最關鍵的是<<<s左位移運算。位移運算以後，原文丟失，好比0101左移2位後爲0100，由於原文發生了丟失，無論什麼算法都沒法還原原文，這就是摘要算法不可逆的緣由。

第四步：拼接4個變化以後的初始值

這一步就是單純的拼接A、B、C、D，最終輸出。其中，會存在MD5(32)和MD5(16)這些輸出結果，其實MD5(16)就是截取MD5(32)的一部分獲得的值，以下：

摘要算法的特色

不可逆

沒法經過輸出值反推出輸入值，只能經過暴力枚舉來進行破解。

輸出長度固定

MD5固定長度爲128，SHA-1位164，SHA-2根據加密級別有幾種可選：22四、25六、38四、512。SHA-3則爲全新的算法。

速度快

加密速度極快

惟一性（正確處理碰撞）

輸入相同則輸出絕對相同。在正確處理碰撞的狀況下，也能夠保證輸入不一樣則輸出也不一樣。

摘要算法的使用場景

一、簽名&&數字證書

單純的簽名就是數據的完整性，也就是數據未被篡改。一般簽名和數字簽名或者數字證書一塊兒出現。

摘要算法能夠保證數據的hash值的惟一性，可是攻擊者能夠修改元數據的同時修改hash值，因此摘要算法+RSA構成了數字證書體系(我的)，使用私鑰加密hash值並將公鑰附加在證書中，這樣就能夠避免攻擊者對元數據和hash值的同時篡改。

可是我的公私鑰畢竟容易被攻擊和竊取，爲了防範這種狀況，CA機構的介入讓(摘要算法+RSA+CA)構成了CA證書體系。通常的電腦系統以及主流的工具(好比瀏覽器)都會和CA機構合做，也就是嵌入了CA機構的公鑰，理論上只要CA機構的私鑰不被竊取，這一套加密規則就是安全的。而apple中的簽名機制則是根據本身的發佈模式進行了強化，造成了本身的一套簽名加密規則。因此在向apple申請證書時發送給apple的csr文件就包含我的信息和我的公鑰：

CA機構的做用能夠說的更詳細一點，CA機構能夠依靠本身的權威形象給本身站臺，另一個CA機構能夠給我的/機構站臺。通常來說，我的獎本身的公鑰和信息發送給CA機構，CA機構用本身的私鑰進行簽名，也就是用本身的私鑰對我的/機構的信息和公鑰進行加密以後發佈數字證書，數字證書裏面包含：我的/機構的信息、我的/機構的公鑰、CA機構的信息、加密的規則的一些信息

二、數據完整性的驗證

這種狀況下，早期可能會用於接口傳輸時，入參的一致性對比，可是如今基本不會使用到了，要使用也會有一套相對複雜的規則來保證安全。比較常見並且如今仍然在被普遍使用的一個場景是：文件下載時驗證文件的完整性。

官方對本身文件進行MD5計算並將對應的MD5值公佈到官網上，用戶下載後只要對本身下載的文件進行MD5操做後校驗這兩個hash值，就知道本身下載的文件是否安全。這種狀況下，只有攻擊者攻克了官方網站而且讓用戶下載到了攻擊者指定的文件，且用戶在校驗MD5碼時官網還處於未恢復的狀況下，攻擊纔會有效，這基本不可能，也沒有太大意義。

三、hash表

hash表通常用於數據存儲，這也是對摘要算法的碰撞處理的一個典型。

四、早期時用於祕鑰的加密傳輸

早期傳輸用戶的密碼，或者服務器保存用戶密碼時，會將用戶的密碼通過MD5加鹽，以密文的形式保存在數據庫中，這樣能夠保證在不知道加鹽規則的狀況下，即便數據庫被攻擊，攻擊者拿到的也只是密文，沒法解密出明文，即便知道了加鹽規則，仍然須要暴力加鹽枚舉。另外，有良心的服務商也不肯意去存儲用戶的密碼，因此這種模式下的服務商，不大會提供找回原密碼的服務，只會提供重置密碼服務，由於MD5的不可逆性，他本身也不知道原密碼是啥。

被破解了還能用嗎

學習一個東西就要知道其使用場景。另外，理論上沒有絕對安全的加密規則。破解的本質就是成本和代價的權衡。

如上所講，摘要算法的破解只有在祕鑰傳輸上有較大的意義，經過暴力枚舉以後獲取到對應的密碼以幫助本身獲利。在安全要求較高的金融行業，已經不使用MD5加密相關信息了，就算是普通行業，仍然能夠經過MD5加鹽、MD5後再次MD五、使用相對安全的SHA-2來實現加密。綜上，摘要算法雖然已經被破解，可是仍然能夠在不少地方發揮做用，尤爲是數字證書上。