【轉載】這是一個微信公衆號的文章,內容挺不錯的算法
區塊鏈(blockchain)是眼下的大熱門,新聞媒體大量報道,宣稱它將創造將來。數據庫
但是,簡單易懂的入門文章卻不多。區塊鏈究竟是什麼,有何特別之處,不多有解釋。服務器
下面,我就來嘗試,寫一篇最好懂的區塊鏈教程。畢竟它也不是很難的東西,核心概念很是簡單,幾句話就能說清楚。我但願讀完本文,你不只能夠理解區塊鏈,還會明白什麼是挖礦、爲何挖礦愈來愈難等問題。微信
須要說明的是,我並不是這方面的專家。雖然很早就關注,可是仔細地瞭解區塊鏈,仍是從今年初開始。文中的錯誤和不許確的地方,歡迎你們指正。網絡
區塊鏈是什麼?一句話,它是一種特殊的分佈式數據庫。分佈式
首先,區塊鏈的主要做用是儲存信息。任何須要保存的信息,均可以寫入區塊鏈,也能夠從裏面讀取,因此它是數據庫。區塊鏈
其次,任何人均可以架設服務器,加入區塊鏈網絡,成爲一個節點。區塊鏈的世界裏面,沒有中心節點,每一個節點都是平等的,都保存着整個數據庫。你能夠向任何一個節點,寫入/讀取數據,由於全部節點最後都會同步,保證區塊鏈一致。ui
分佈式數據庫並不是新發明,市場上早有此類產品。可是,區塊鏈有一個革命性特色。加密
區塊鏈沒有管理員,它是完全無中心的。其餘的數據庫都有管理員,可是區塊鏈沒有。若是有人想對區塊鏈添加審覈,也實現不了,由於它的設計目標就是防止出現居於中心地位的管理當局。spa
正是由於沒法管理,區塊鏈才能作到沒法被控制。不然一旦大公司大集團控制了管理權,他們就會控制整個平臺,其餘使用者就都必須聽命於他們了。
可是,沒有了管理員,人人均可以往裏面寫入數據,怎麼才能保證數據是可信的呢?被壞人改了怎麼辦?請接着往下讀,這就是區塊鏈奇妙的地方。
區塊鏈由一個個區塊(block)組成。區塊很像數據庫的記錄,每次寫入數據,就是建立一個區塊。
每一個區塊包含兩個部分。
區塊頭(Head):記錄當前區塊的元信息
區塊體(Body):實際數據
區塊頭包含了當前區塊的多項元信息。
生成時間
實際數據(即區塊體)的 Hash
上一個區塊的 Hash
...
這裏,你須要理解什麼叫 Hash,這是理解區塊鏈必需的。
所謂 Hash 就是計算機能夠對任意內容,計算出一個長度相同的特徵值。區塊鏈的 Hash 長度是256位,這就是說,無論原始內容是什麼,最後都會計算出一個256位的二進制數字。並且能夠保證,只要原始內容不一樣,對應的 Hash 必定是不一樣的。
舉例來講,字符串123
的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0
(十六進制),轉成二進制就是256位,並且只有123
能獲得這個 Hash。
所以,就有兩個重要的推論。
推論1:每一個區塊的 Hash 都是不同的,能夠經過 Hash 標識區塊。
推論2:若是區塊的內容變了,它的 Hash 必定會改變。
區塊與 Hash 是一一對應的,每一個區塊的 Hash 都是針對"區塊頭"(Head)計算的。
Hash = SHA256(區塊頭)
上面就是區塊 Hash 的計算公式,Hash 由區塊頭惟一決定,SHA256
是區塊鏈的 Hash 算法。
前面說過,區塊頭包含不少內容,其中有當前區塊體的 Hash(注意是"區塊體"的 Hash,而不是整個區塊),還有上一個區塊的 Hash。這意味着,若是當前區塊的內容變了,或者上一個區塊的 Hash 變了,必定會引發當前區塊的 Hash 改變。
這一點對區塊鏈有重大意義。若是有人修改了一個區塊,該區塊的 Hash 就變了。爲了讓後面的區塊還能連到它,該人必須同時修改後面全部的區塊,不然被改掉的區塊就脫離區塊鏈了。因爲後面要提到的緣由,Hash 的計算很耗時,同時修改多個區塊幾乎不可能發生,除非有人掌握了全網51%以上的計算能力。
正是經過這種聯動機制,區塊鏈保證了自身的可靠性,數據一旦寫入,就沒法被篡改。這就像歷史同樣,發生了就是發生了,今後再沒法改變。
每一個區塊都連着上一個區塊,這也是"區塊鏈"這個名字的由來。
因爲必須保證節點之間的同步,因此新區塊的添加速度不能太快。試想一下,你剛剛同步了一個區塊,準備基於它生成下一個區塊,但這時別的節點又有新區塊生成,你不得不放棄作了一半的計算,再次去同步。由於每一個區塊的後面,只能跟着一個區塊,你永遠只能在最新區塊的後面,生成下一個區塊。因此,你別無選擇,一聽到信號,就必須馬上同步。
因此,區塊鏈的發明者中本聰(這是假名,真實身份至今未知)故意讓添加新區塊,變得很困難。他的設計是,平均每10分鐘,全網才能生成一個新區塊,一小時也就六個。
這種產出速度不是經過命令達成的,而是故意設置了海量的計算。也就是說,只有經過極其大量的計算,才能獲得當前區塊的有效 Hash,從而把新區塊添加到區塊鏈。因爲計算量太大,因此快不起來。
這個過程就叫作採礦(mining),由於計算有效 Hash 的難度,比如在全世界的沙子裏面,找到一粒符合條件的沙子。計算 Hash 的機器就叫作礦機,操做礦機的人就叫作礦工。
讀到這裏,你可能會有一個疑問,人們都說採礦很難,但是採礦不就是用計算機算出一個 Hash 嗎,這正是計算機的強項啊,怎麼會變得很難,遲遲算不出來呢?
原來不是任意一個 Hash 均可以,只有知足條件的 Hash 纔會被區塊連接受。這個條件特別苛刻,使得絕大部分 Hash 都不知足要求,必須重算。
原來,區塊頭包含一個難度係數(difficulty),這個值決定了計算 Hash 的難度。舉例來講,第100000個區塊的難度係數是 14484.16236122。
區塊鏈協議規定,使用一個常量除以難度係數,能夠獲得目標值(target)。顯然,難度係數越大,目標值就越小。
Hash 的有效性跟目標值密切相關,只有小於目標值的 Hash 纔是有效的,不然 Hash 無效,必須重算。因爲目標值很是小,Hash 小於該值的機會極其渺茫,可能計算10億次,纔算中一次。這就是採礦如此之慢的根本緣由。
區塊頭裏面還有一個 Nonce 值,記錄了 Hash 重算的次數。第 100000 個區塊的 Nonce 值是274148111
,即計算了 2.74 億次,才獲得了一個有效的 Hash,該區塊才能加入區塊鏈。
就算採礦很難,但也無法保證,正好十分鐘產出一個區塊,有時一分鐘就算出來了,有時幾個小時可能也沒結果。整體來看,隨着硬件設備的提高,以及礦機的數量增加,計算速度必定會愈來愈快。
爲了將產出速率恆定在十分鐘,中本聰還設計了難度係數的動態調節機制。他規定,難度係數每兩週(2016個區塊)調整一次。若是這兩週裏面,區塊的平均生成速度是9分鐘,就意味着比法定速度快了10%,所以難度係數就要調高10%;若是平均生成速度是11分鐘,就意味着比法定速度慢了10%,所以難度係數就要調低10%。
難度係數越調越高(目標值愈來愈小),致使了採礦愈來愈難。
即便區塊鏈是可靠的,如今還有一個問題沒有解決:若是兩我的同時向區塊鏈寫入數據,也就是說,同時有兩個區塊加入,由於它們都連着前一個區塊,就造成了分叉。這時應該採納哪個區塊呢?
如今的規則是,新節點老是採用最長的那條區塊鏈。若是區塊鏈有分叉,將看哪一個分支在分叉點後面,先達到6個新區塊(稱爲"六次確認")。按照10分鐘一個區塊計算,一小時就能夠確認。
因爲新區塊的生成速度由計算能力決定,因此這條規則就是說,擁有大多數計算能力的那條分支,就是正宗的比特鏈。
區塊鏈做爲無人管理的分佈式數據庫,從2009年開始已經運行了8年,沒有出現大的問題。這證實它是可行的。
可是,爲了保證數據的可靠性,區塊鏈也有本身的代價。一是效率,數據寫入區塊鏈,最少要等待十分鐘,全部節點都同步數據,則須要更多的時間;二是能耗,區塊的生成須要礦工進行無數無心義的計算,這是很是耗費能源的。
所以,區塊鏈的適用場景,其實很是有限。
不存在全部成員都信任的管理當局
寫入的數據不要求實時使用
挖礦的收益可以彌補自己的成本
若是沒法知足上述的條件,那麼傳統的數據庫是更好的解決方案。
目前,區塊鏈最大的應用場景(可能也是惟一的應用場景),就是以比特幣爲表明的加密貨幣。下一篇文章,我將會介紹比特幣的入門知識。