區塊鏈入門

時間 2020-06-23 標籤區塊入門

1、區塊鏈的本質

區塊鏈是什麼？一句話，它是一種特殊的分佈式數據庫。html

首先，區塊鏈的主要做用是儲存信息。任何須要保存的信息，均可以寫入區塊鏈，也能夠從裏面讀取，因此它是數據庫。算法

其次，任何人均可以架設服務器，加入區塊鏈網絡，成爲一個節點。區塊鏈的世界裏面，沒有中心節點，每一個節點都是平等的，都保存着整個數據庫。你能夠向任何一個節點，寫入/讀取數據，由於全部節點最後都會同步，保證區塊鏈一致。數據庫

2、區塊鏈的最大特色

分佈式數據庫並不是新發明，市場上早有此類產品。可是，區塊鏈有一個革命性特色。服務器

區塊鏈沒有管理員，它是完全無中心的。其餘的數據庫都有管理員，可是區塊鏈沒有。若是有人想對區塊鏈添加審覈，也實現不了，由於它的設計目標就是防止出現居於中心地位的管理當局。網絡

正是由於沒法管理，區塊鏈才能作到沒法被控制。不然一旦大公司大集團控制了管理權，他們就會控制整個平臺，其餘使用者就都必須聽命於他們了。分佈式

可是，沒有了管理員，人人均可以往裏面寫入數據，怎麼才能保證數據是可信的呢？被壞人改了怎麼辦？請接着往下讀，這就是區塊鏈奇妙的地方。區塊鏈

3、區塊

區塊鏈由一個個區塊（block）組成。區塊很像數據庫的記錄，每次寫入數據，就是建立一個區塊。加密

每一個區塊包含兩個部分。設計

區塊頭（Head）：記錄當前區塊的特徵值

區塊體（Body）：實際數據

區塊頭包含了當前區塊的多項特徵值。3d

生成時間

實際數據（即區塊體）的哈希

上一個區塊的哈希

...

這裏，你須要理解什麼叫哈希（hash），這是理解區塊鏈必需的。

所謂"哈希"就是計算機能夠對任意內容，計算出一個長度相同的特徵值。區塊鏈的哈希長度是256位，這就是說，無論原始內容是什麼，最後都會計算出一個256位的二進制數字。並且能夠保證，只要原始內容不一樣，對應的哈希必定是不一樣的。

舉例來講，字符串123的哈希是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0（十六進制），轉成二進制就是256位，並且只有123能獲得這個哈希。（理論上，其餘字符串也有可能獲得這個哈希，可是機率極低，能夠近似認爲不可能發生。）

所以，就有兩個重要的推論。

推論1：每一個區塊的哈希都是不同的，能夠經過哈希標識區塊。

推論2：若是區塊的內容變了，它的哈希必定會改變。

4、 Hash 的不可修改性

區塊與哈希是一一對應的，每一個區塊的哈希都是針對"區塊頭"（Head）計算的。也就是說，把區塊頭的各項特徵值，按照順序鏈接在一塊兒，組成一個很長的字符串，再對這個字符串計算哈希。

Hash = SHA256( 區塊頭 )

上面就是區塊哈希的計算公式，SHA256是區塊鏈的哈希算法。注意，這個公式裏面只包含區塊頭，不包含區塊體，也就是說，哈希由區塊頭惟一決定，

前面說過，區塊頭包含不少內容，其中有當前區塊體的哈希，還有上一個區塊的哈希。這意味着，若是當前區塊體的內容變了，或者上一個區塊的哈希變了，必定會引發當前區塊的哈希改變。

這一點對區塊鏈有重大意義。若是有人修改了一個區塊，該區塊的哈希就變了。爲了讓後面的區塊還能連到它（由於下一個區塊包含上一個區塊的哈希），該人必須依次修改後面全部的區塊，不然被改掉的區塊就脫離區塊鏈了。因爲後面要提到的緣由，哈希的計算很耗時，短期內修改多個區塊幾乎不可能發生，除非有人掌握了全網51%以上的計算能力。

正是經過這種聯動機制，區塊鏈保證了自身的可靠性，數據一旦寫入，就沒法被篡改。這就像歷史同樣，發生了就是發生了，今後再沒法改變。

每一個區塊都連着上一個區塊，這也是"區塊鏈"這個名字的由來。

5、採礦

因爲必須保證節點之間的同步，因此新區塊的添加速度不能太快。試想一下，你剛剛同步了一個區塊，準備基於它生成下一個區塊，但這時別的節點又有新區塊生成，你不得不放棄作了一半的計算，再次去同步。由於每一個區塊的後面，只能跟着一個區塊，你永遠只能在最新區塊的後面，生成下一個區塊。因此，你別無選擇，一聽到信號，就必須馬上同步。

因此，區塊鏈的發明者中本聰（這是假名，真實身份至今未知）故意讓添加新區塊，變得很困難。他的設計是，平均每10分鐘，全網才能生成一個新區塊，一小時也就六個。

這種產出速度不是經過命令達成的，而是故意設置了海量的計算。也就是說，只有經過極其大量的計算，才能獲得當前區塊的有效哈希，從而把新區塊添加到區塊鏈。因爲計算量太大，因此快不起來。

這個過程就叫作採礦（mining），由於計算有效哈希的難度，比如在全世界的沙子裏面，找到一粒符合條件的沙子。計算哈希的機器就叫作礦機，操做礦機的人就叫作礦工。

6、難度係數

讀到這裏，你可能會有一個疑問，人們都說採礦很難，但是採礦不就是用計算機算出一個哈希嗎，這正是計算機的強項啊，怎麼會變得很難，遲遲算不出來呢？

原來不是任意一個哈希均可以，只有知足條件的哈希纔會被區塊連接受。這個條件特別苛刻，使得絕大部分哈希都不知足要求，必須重算。

原來，區塊頭包含一個難度係數（difficulty），這個值決定了計算哈希的難度。舉例來講，第100000個區塊的難度係數是 14484.16236122。

區塊鏈協議規定，使用一個常量除以難度係數，能夠獲得目標值（target）。顯然，難度係數越大，目標值就越小。

哈希的有效性跟目標值密切相關，只有小於目標值的哈希纔是有效的，不然哈希無效，必須重算。因爲目標值很是小，哈希小於該值的機會極其渺茫，可能計算10億次，纔算中一次。這就是採礦如此之慢的根本緣由。

前面說過，當前區塊的哈希由區塊頭惟一決定。若是要對同一個區塊反覆計算哈希，就意味着，區塊頭必須不停地變化，不然不可能算出不同的哈希。區塊頭裏面全部的特徵值都是固定的，爲了讓區塊頭產生變化，中本聰故意增長了一個隨機項，叫作 Nonce。

Nonce 是一個隨機值，礦工的做用其實就是猜出 Nonce 的值，使得區塊頭的哈希能夠小於目標值，從而可以寫入區塊鏈。Nonce 是很是難猜的，目前只能經過窮舉法一個個試錯。根據協議，Nonce 是一個32位的二進制值，即最大能夠到21.47億。第 100000 個區塊的 Nonce 值是274148111，能夠理解成，礦工從0開始，一直計算了 2.74 億次，才獲得了一個有效的 Nonce 值，使得算出的哈希可以知足條件。

運氣好的話，也許一會就找到了 Nonce。運氣很差的話，可能算完了21.47億次，都沒有發現 Nonce，即當前區塊體不可能算出知足條件的哈希。這時，協議容許礦工改變區塊體，開始新的計算。

7、難度係數的動態調節

正如上一節所說，採礦具備隨機性，無法保證正好十分鐘產出一個區塊，有時一分鐘就算出來了，有時幾個小時可能也沒結果。整體來看，隨着硬件設備的提高，以及礦機的數量增加，計算速度必定會愈來愈快。

爲了將產出速率恆定在十分鐘，中本聰還設計了難度係數的動態調節機制。他規定，難度係數每兩週（2016個區塊）調整一次。若是這兩週裏面，區塊的平均生成速度是9分鐘，就意味着比法定速度快了10%，所以接下來的難度係數就要調高10%；若是平均生成速度是11分鐘，就意味着比法定速度慢了10%，所以接下來的難度係數就要調低10%。

難度係數越調越高（目標值愈來愈小），致使了採礦愈來愈難。

8、區塊鏈的分叉

即便區塊鏈是可靠的，如今還有一個問題沒有解決：若是兩我的同時向區塊鏈寫入數據，也就是說，同時有兩個區塊加入，由於它們都連着前一個區塊，就造成了分叉。這時應該採納哪個區塊呢？

如今的規則是，新節點老是採用最長的那條區塊鏈。若是區塊鏈有分叉，將看哪一個分支在分叉點後面，先達到6個新區塊（稱爲"六次確認"）。按照10分鐘一個區塊計算，一小時就能夠確認。

因爲新區塊的生成速度由計算能力決定，因此這條規則就是說，擁有大多數計算能力的那條分支，就是正宗的區塊鏈。

9、總結

區塊鏈做爲無人管理的分佈式數據庫，從2009年開始已經運行了8年，沒有出現大的問題。這證實它是可行的。

可是，爲了保證數據的可靠性，區塊鏈也有本身的代價。一是效率，數據寫入區塊鏈，最少要等待十分鐘，全部節點都同步數據，則須要更多的時間；二是能耗，區塊的生成須要礦工進行無數無心義的計算，這是很是耗費能源的。

所以，區塊鏈的適用場景，其實很是有限。

不存在全部成員都信任的管理當局

寫入的數據不要求實時使用

挖礦的收益可以彌補自己的成本

若是沒法知足上述的條件，那麼傳統的數據庫是更好的解決方案。

目前，區塊鏈最大的應用場景（可能也是惟一的應用場景），就是以比特幣爲表明的加密貨幣。