Hash,通常翻譯爲「散列」,也有直接音譯爲「哈希」的,就是把任意長度的輸入(又叫作預映射,pre-image),經過散列算法,變換成固定長度的輸出,該輸出就是散列值。這種轉換是一種壓縮映射,也就是,散列值的空間一般遠小於輸入的空間,不一樣的輸入可能會散列程相同的輸出,而不可能從散列值來惟一的肯定輸入值。python
簡單的說就是一種將任意長度的消息壓縮到某一固定長度的消息摘要的函數。git
HASH主要用於信息安全領域中加密算法,他把一些不一樣長度的信息轉化成雜亂的128位的編碼裏,叫作HASH值。也能夠說,hash就是找到一種數據內容和數據存放地址之間的映射關係。算法
一、什麼是MD5算法數據庫
MD5訊息摘要演算法(英文:MD5 Message-Digest Algorithm),一種被普遍使用的密碼雜湊函數,能夠產生一個128位的散列值(hash value),用於確保信息傳輸完整一致。MD5的前身有MD二、MD3和MD4。緩存
二、MD5的功能安全
輸入任意長度的信息,通過處理,輸出爲128位的信息(數字指紋);函數
不一樣的輸入獲得的不一樣的結果(惟一性);網站
三、MD5算法的特色編碼
一、壓縮性:任意長度的數據,算出的MD5值的長度都是固定的。加密
二、容易計算:從原數據計算出MD5值很容易。
三、抗修改性:對原數據進行任何改動,修改一個字節生成的MD5值區別也會很大。
四、強抗碰撞:已知原數據和MD5,想找到一個具備相同MD5值的數據(即僞造數據)是很是困難的。
四、MD5算法是否可逆?
MD5不可逆,緣由是其是一種散列函數,使用的是hash算法,在計算過程當中原文的部分信息是丟失了的。
五、MD5用途
一、防止被篡改
好比發送一個電子文檔,發送前,我先獲得MD5的輸出結果a。而後在對方收到電子文檔後,對方也獲得一個MD5的輸出結果b。若是a與b同樣就表明中途未被篡改。 好比我提供文件下載,爲了防止不法分子在安裝程序中添加木馬,我能夠在網站上公佈由安裝文件獲得的MD5輸出結果。 SVN在檢測文件是否在CheckOut後被修改過,也是用到了MD5.
二、防止直接看到明文
如今不少網站在數據庫存儲用戶的密碼的時候都是存儲用戶密碼的MD5值。這樣就算不法分子獲得數據庫的用戶密碼的MD5值,也沒法知道用戶的密碼。(好比在UNIX系統中用戶的密碼就是以MD5(或其它相似的算法)經加密後存儲在文件系統中。當用戶登陸的時候,系統把用戶輸入的密碼計算成MD5值,而後再去和保存在文件系統中的MD5值進行比較,進而肯定輸入的密碼是否正確。經過這樣的步驟,系統在並不知道用戶密碼的明碼的狀況下就能夠肯定用戶登陸系統的合法性。這不但能夠避免用戶的密碼被具備系統管理員權限的用戶知道,並且還在必定程度上增長了密碼被破解的難度。)
三、防止抵賴(數字簽名)
這須要一個第三方認證機構。例如A寫了一個文件,認證機構對此文件用MD5算法產生摘要信息並作好記錄。若之後A說這文件不是他寫的,權威機構只需對此文件從新產生摘要信息,而後跟記錄在冊的摘要信息進行比對,相同的話,就證實是A寫的了。這就是所謂的「數字簽名」。
安全哈希算法(Secure Hash Algorithm)主要適用於數字簽名標準(Digital Signature Standard DSS)裏面定義的數字簽名算法(Digital Signature Algorithm DSA)。對於長度小於2^64位的消息,SHA1會產生一個160位的消息摘要。當接收到消息的時候,這個消息摘要能夠用來驗證數據的完整性。
SHA是美國國家安全局設計的,由美國國家標準和技術研究院發佈的一系列密碼散列函數。
因爲MD5和SHA-1於2005年被山東大學的教授王小云破解了,科學家們又推出了SHA224, SHA256, SHA384, SHA512,固然位數越長,破解難度越大,但同時生成加密的消息摘要所耗時間也更長。目前最流行的是加密算法是SHA-256 .
因爲MD5與SHA-1均是從MD4發展而來,它們的結構和強度等特性有不少類似之處,SHA-1與MD5的最大區別在於其摘要比MD5摘要長32 比特。對於強行攻擊,產生任何一個報文使之摘要等於給定報文摘要的難度:MD5是2128數量級的操做,SHA-1是2160數量級的操做。產生具備相同摘要的兩個報文的難度:MD5是264是數量級的操做,SHA-1 是280數量級的操做。於是,SHA-1對強行攻擊的強度更大。但因爲SHA-1的循環步驟比MD5多80:64且要處理的緩存大160比特:128比特,SHA-1的運行速度比MD5慢。
用於加密相關的操做,3.x裏用hashlib代替了md5模塊和sha模塊,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。
import hashlib # md5 m = hashlib.md5() m.update(b"Hello") m.update(b"It's me") print(m.digest()) # 返回2進制格式的hash值 m.update(b"It's been a long time since last time we ...") print(m.hexdigest()) # 返回16進制格式的hash值 # sha1 s1 = hashlib.sha1() s1.update("小猿圈".encode("utf-8")) s1.hexdigest() # sha256 s256 = hashlib.sha256() s256.update("小猿圈".encode("utf-8")) s256.hexdigest() # sha512 s512 = hashlib.sha256() s512.update("小猿圈".encode("utf-8")) s512.hexdigest()