分佈式系統中節點之間的同步造成區塊鏈

時間 2019-12-13

標籤分佈式系統節點之間同步造成區塊欄目系統架構简体版

原文原文鏈接

鏈客，專爲開發者而生，有問必答！算法

此文章來自鏈客區塊鏈技術問答社區，未經容許拒絕轉載。
服務器

分佈式系統由Tanenbaum定義，「分佈式系統是一組獨立的計算機，在」分佈式系統 — 原理和範例「中做爲用戶的單一，連貫的系統出現」。網絡

區塊鏈經過構建全球分佈式系統，嘗試實現分散的新數據存儲和組織結構。併發

首先，定位到分佈式系統的緣由主要是可擴展性，位置和可用性。區塊鏈也不例外。地理可擴展性，造成全球價值存儲網絡/信息保護區域，包括非集中式結構下的防篡改/零停機時間的可用性。這些將來都是使用分佈式系統在block中實現的。app

0.目錄異步

X.區塊鏈和分佈式系統分佈式

1.簡介（同步和總體流程概述）性能

2.時鐘同步區塊鏈

2–1。物理時鐘（時鐘和時鐘偏移）spa

2–2。時鐘同步算法（網絡時間協議（NTP）/伯克利算法）

3.邏輯時鐘

3–1。 Lamport的邏輯時鐘（徹底有序的多播）

3–2。矢量時鐘（因果訂單組播）

4.獨家控制

4–1。集中算法

4–2。分散算法

4–3。分佈式算法

5.選舉算法

5–1。欺負算法

5–2。環算法

6.阻止鏈和同步做爲分佈式系統

6–1。塊鏈和時鐘同步（塊鏈和物理/邏輯時鐘）

6–2。塊鏈和獨佔控制算法（PoW·PoS·BFT中的獨佔控制算法）

6–3。塊鏈和領導者選舉算法（PoW·PoS·BFT中的領導者選擇算法）

1.簡介（同步和總體流程概述）

與集中式系統不一樣，在分佈式系統中就時間達成一致並不容易。

在前一種狀況下，能夠基於全局共享時鐘肯定絕對順序關係，可是在後一種狀況下，因爲存在時鐘值錯誤和對應時間，所以難以共享絕對時間。

可是，絕對時間的順序並非絕對必要的，若是相對順序是固定的，一般就足夠了。咱們如何同步分佈式系統中的全部時鐘？此外，須要哪些算法才能在分佈式系統中實現一致性同步？

在本文中，將按如下順序解釋節點之間的同步。

時鐘同步是如何發生的？

使用邏輯時鐘和矢量時鐘的相對排序方法

關於分佈式系統一致性的排除控制算法

關於分佈式系統中的領導選舉算法

2.時鐘同步

2–1. 物理時鐘

時鐘和時鐘歪斜

大多數計算機都有保持時間的電路，這種設備稱爲「時鐘」。這是基於頻率的振動，該振動能夠經過晶體類型，切割方法和向精確加工的石英增長張力時的壓力大小明肯定義。

雖然這個頻率至關穩定，但不能保證不一樣計算機的全部晶體都能以徹底相同的頻率運行。由此引發的同步時間的差別稱爲時鐘誤差。

在這種狀況下，特別是在實時系統中，如何使多個時鐘與現實時鐘同步以及如何同步時鐘是一個問題。

現實世界中的時間最初基於平均太陽秒，但如今銫133過渡9,192,631,770次的時間定義爲1秒，而且定義了國際原子時間和通用協調時間（UTC）。爲了向須要準確時間的人提供UTC，使用WWV而且時間以±10毫秒的精度提供。

2–2. 時鐘同步算法

可是，大多數機器沒有WWV接收器。所以，每臺機器都須要時間跟蹤和管理算法，以便全部機器均可以同步時間。

順便說起，用於肯定是否須要從新同步的錯誤，即時鐘偏移，以下測量。

將H定義爲每臺機器計數的晶體振動引發的每秒中斷次數（刻度數），並將C表示爲該時鐘的值。設Cp（t）表示機器的時鐘值，當UTC時間爲t時。

若是將p定義爲定義容許的時鐘誤差量的最大漂移率，則假定它在如下範圍內運行。

1-p <= dC/dt <= 1+p

也就是說，在從先前同步開始通過At秒以後，兩個時鐘最多分開2pΔt。

當保證在操做執行時沒有大於＆的誤差時，必須至少每＆/2p從新同步軟件。

網絡時間協議（NTP）

在許多協議中很常見，[Cristian，1989]首先提出的方法是一種與客戶服務器通訊的方法。因爲時間服務器具備WWV接收器或具備準確的時鐘，所以它能夠提供當前時間。在與服務器通訊時，重要的是延遲報告消息傳播延遲的時間，可是經過估計延遲，這裏能夠最小化錯誤。目前，已知NTP可以在1至50毫秒的範圍內實現精度。

伯克利算法

在諸如NTP的許多算法中，時間服務器是被動的而且僅回答查詢。另外一方面，在Berkeley算法中，時間服務器接收每一個參與節點所持有的時間，而且還基於平均值改變其本身的時間。當時間值沒必要與現實世界有關係時，很容易在同一當前時間達成一致，而且它對此算法有效。

3.邏輯時鐘

到目前爲止，雖然咱們描述了一種根據實際時鐘將時鐘與絕對時間同步做爲參考的方法，但一般只執行相對同步。這裏，邏輯時鐘的概念用於肯定相對順序。

3–1. Lamport的邏輯時鐘

爲了同步邏輯時鐘，Lamport定義了一個名爲happen-before的關係。表達式a→b表示「a發生在b以前」，這意味着事件首先發生，而後全部進程都贊成事件b將發生。發生以前 — 能夠在如下兩種狀況下直接觀察到關係。

若是a和b是同一過程當中的事件且a出如今b以前，則a→b爲真。

若是a是由一個進程發送的消息的事件，而且b是由另外一個進程接收的該消息的事件，那麼a→b也是如此。在發送消息以前沒法接收消息，即便消息同時也須要有限的非零時間。

由於發生前關係處於過渡關係中，若是a→b和b→c，則能夠證實a→c。若是事件x，y出如今不交換消息的不一樣進程中，則x→y和y→x都不爲真，而且這些事件被認爲是併發的。（以前發生的關係未知。）

利用邏輯時鐘，經過分配全部進程對每一個事件a一致的時間C（a）來測量相對時間。若是這些時間值是a→b，則經過向時間添加正值來校訂它們，使得C（a）<C（b）。經過分配以下圖所示的時間值，能夠掌握以前發生的關係。

在Lamport的邏輯時鐘中，若是a→b，則能夠證實C（a）<C（b），但若是C（a）<C（b）則a→b不必定成立。換句話說，a→b是C（a）<C（b）的必要條件，而且不是充分條件。 Lamport的邏輯時鐘增長了改進，它是一個矢量時鐘，能夠知足這種必要和充足的條件。

徹底有序的多播

有關詳細信息，請參閱「分佈式系統一致性」一文中的內容

在許多狀況下，有必要在重複的副本之間執行徹底有序的多播。換句話說，全部消息都須要以相同的順序傳遞給每一個收件人。 Lamport的邏輯時鐘可用於在徹底分佈式系統下實現徹底有序的多播。

當進程收到某個消息時，它會根據時間戳按順序放入本地隊列。收件人向另外一個進程多播確認。若是您按照Lamport的算法調整本地時鐘，則全部進程實際上都具備本地隊列的相同副本。只有當消息位於隊列的頭部而且被全部其餘進程確認時，纔有一個進程能夠將隊列中的消息傳遞給正在運行的應用程序，所以，全部消息都以相同的順序傳遞到各處。換句話說，已經創建了徹底有序的多播。

3–2. 矢量時鐘

使用矢量時鐘，能夠掌握Lamport邏輯時鐘沒法掌握的因果關係。假設事件a的向量時鐘是VC（a），則執行如下步驟，使得a→b成爲VC（a）<VC（b）的必要和充分條件。

在經過網絡發送消息以前，節點Pi向矢量時鐘VCi [i]添加1，或者操做一些內部事件。

若是處理Pi將消息m發送到Pj，則Pi在執行前一步驟以後將m的向量時間戳ts（m）設置爲等於VCi。
當接收到消息m時，進程Pj執行步驟1，將消息分發給應用程序，而後更新其本身的向量時鐘的每一個k，以下所示：VCj [k]←max {VCj [k]，ts（m）[k]}。

因果關係多播

經過使用向量時鐘，能夠實現稍微弱於上述徹底有序多播的因果有序多播。

經過比較矢量時鐘的值並掌握髮生在以前的關係，對於特定事件x，其餘事件能夠被分類爲過去事件，併發事件和將來事件。例如，在上圖中，當事件d用做參考點時，過去事件是a，b，c，i，併發事件是j，l，m，將來事件是f，g，h。

此時，假設因果有序多播是過去事件和因果事件的序列，其中發生全部因果關係，以便在全部過程當中保持一致，可是關於併發事件的順序是可有可無的。經過這種方式，與Lamport的邏輯時鐘不一樣，能夠用向量時鐘來掌握因果關係。

4.獨家控制

多個進程之間的併發操做和協做操做是分佈式系統的基本，可是爲了保證對資源的獨佔訪問，以便經過多個進程同時訪問相同資源時不處於不一致狀態時，須要分佈式排他算法。

分佈式獨佔控制算法能夠分爲如下兩種類型。

基於Token的解決方案

基於權限的方法

在基於Token的方案中，很容易避免Starvation（很長時間內不容許訪問資源）和死鎖（多個進程等待彼此的進展）。一個表明性的例子是Token環算法。可是，當持有Token的過程異常中止而且Token丟失，有必要只生成一個新Token，這種複雜性是一個嚴重的缺點。

許多其餘分散的獨佔控制算法採用基於權限的方法，並有許多不一樣的獲取權限的方法，咱們將分別具體解釋。

4–1. 集中算法

經過模擬單處理器系統的功能，能夠輕鬆實現分佈式系統中獨佔控制的單一訪問。在集中式算法中，一個進程被指定爲協調器，而且當進程訪問共享資源時，請求消息被髮送到協調器以得到許可。若是其餘進程未訪問共享資源，則協調器返回權限響應，而且在接收到回覆以後，所請求的進程執行該進程。

很容易看出，該算法保證了對資源的獨佔訪問，但它具備單點故障的嚴重缺點。雖然這多是大型系統中的性能瓶頸，但這種簡單性帶來的優點仍然能夠彌補這些缺點。

4–2. 分散算法

假設各項都會重複n次。在分散算法中，當進程訪問資源時，須要批准大多數m> n / 2。若是得到大多數批准，則該過程得到許可並能夠進行處理。

雖然該方案解決了集中式算法的單點故障問題，可是若是有太多的節點試圖訪問，則存在另外一個問題，即沒有節點能夠得到足夠的投票而沒法得到充分的性能。

4–3. 分佈式算法

在該算法中，假設系統上全部事件的順序能夠定義爲徹底有序的關係。做爲這個基礎，使用了前一章中描述的Lamport的邏輯時鐘，而且假設沒有消息會丟失。

當進程嘗試訪問共享資源時，它會建立一條消息，其中包含資源名稱，本身的進程號和當前邏輯時鐘，並將其發送給全部其餘進程。當接收到該請求消息時，根據其自身狀態執行如下操做。

若是收件人未訪問該資源且何嘗試訪問該資源，則收件人會向發件人返回「肯定」消息。
若是收件人已在訪問資源，請不要回復並執行排隊請求。
若是收件人正在嘗試訪問資源但還沒有完成，請將輸入消息中的時間戳與發送給其餘進程的消息中的時間戳進行比較，並將較低的一個做爲獲勝者。若是收到的消息具備小的時間戳，則收件人返回OK消息。若是本身的消息具備較小的時間戳，則接收方將不會將輸入消息排隊。

顯然，若是它不像process1或2那樣衝突，這個算法就能正常工做。即便在衝突的狀況下，也只創建了惟一一個進程能夠訪問的條件。

與集中式算法同樣，該算法能夠保證獨佔控制，不會出現死鎖或飢餓。此外，沒有單點故障。儘管如此，單點故障被故障n位置特徵所取代。它能夠經過回覆權限或拒絕權限並引入超時來解決，但也會出現其餘問題，例如須要多播通訊原語。不幸的是，目前還沒有設計出超越集中式算法的分佈式算法，而且仍在研究中。

當比較各個算法時，變爲以下。

5.領導者選舉算法

許多分佈式算法須要一個特殊的過程，它具備領導者做爲協調者或發起者的角色。哪一個過程是領導者，惟一過程是否能夠成爲領導者是一個重要問題，研究人員在過去幾十年中一直在努力。

5–1. 欺負算法

當協調員失敗而且任何進程P注意到該狀況時，P根據如下過程激活選舉。

· P向全部具備比其自身更高數值的進程發送ELECTION消息。

· 若是沒有人回覆，P將贏得選舉併成爲協調員。

· 若是來自具備高於P的數值的過程的答案，則將替換它。 P的工做結束了。

使用該算法，能夠惟一地肯定協調器。可是，該算法須要大量的消息和數據流量，能夠說是冗餘的。做爲替代方案，存在環算法。

5–2. 環算法

與通常環算法不一樣，該算法不使用Token。發現協調器不工做的任何進程構造一個包含其本身的進程號的ELECTION消息，並將該消息發送給其後繼者（環網中的下一個節點）。若是繼任者失敗，請跳過。若是沒有比您更高的數值的節點，您的消息將仍然返回給您本身的進程號，所以它將被指定爲協調員。

在該算法中，執行具備減小數量的消息的領導者選舉，可是還能夠經過將消息的目的地設置到兩個相鄰節點來實現具備較少許數據流量的算法。

6.阻止鏈和同步做爲分佈式系統

所以，在做爲分佈式系統之一的塊鏈中，進程之間的同步如何發生？

6–1. 區塊鏈和時鐘同步

塊鏈和邏輯時鐘

首先，考慮是否可使用區塊鏈中的物理時鐘來掌握絕對時間關係。如第2章所述，參與網絡的每一個節點並不老是保持正確的物理時鐘，而且應該存在時鐘誤差。因爲比特幣區塊鏈的平均生成時間是10分鐘，所以認爲即便必定程度的大時鐘誤差也是可接受的。然而，當節點散佈在世界各地時難以同步各個物理時鐘，而且還可能存在假裝時鐘的節點。經過引入網絡時間協議（NTP）來從新同步節點之間的正確時間是一項困難的技術。

區塊鏈和邏輯時鐘

所以，準備邏輯時鐘而不是物理時鐘是切合實際的。實際上，經過在塊中加入時間標記，能夠製備出與Lamport邏輯時鐘很是類似的機制。

如[比特幣：點對點電子現金系統Satoshi Nakamoto]中所述，對做爲礦工的區塊執行寫操做的每一個節點自己具備做爲時間戳服務器的角色。每一個時間戳經過在其哈希中包含前一個時間戳來造成鏈。可是，沒法保證這些節點保持正確的物理時鐘。時間戳的數值，即每一個事務的順序和時間相對模糊。

因爲時鐘的這種模糊性，有可能會進行雙重付款。可是，在比特幣區塊鏈中，只有最長的鏈是合法的，在次要驗證後丟棄不正確的交易。所以，區塊的順序隨着時間的流逝惟一肯定。隨着每一個時間戳的增長，前一個時間戳被增強。

總之，在區塊鏈中的模糊時間戳下，事務的順序一致性是不許確的。然而，利用鏈式鏈接的簡單機制，每一個交易的發生前關係隨着時間的推移而創建。此外，還有一種激勵結構，以便礦工轉移到良好，交易不一致的順序不會發生。

能夠說，實現相似於Lamport的邏輯時鐘的時鐘同步方法，由於事務之間的相對順序關係，即發生在以前的關係變得更清楚。

對於大多數交易，沒有因果關係，所以若是您引入向量時鐘並採用因果關係排序的概念，則能夠極大地放鬆訂單關係的約束。然而，在區塊鏈中，因爲結構自己默認共享全部塊的順序關係，因此保持總排序（相對於在一段時間以後的塊）。

6–2. 區塊鏈和獨佔控制算法

即便在做爲分佈式系統的區塊鏈中，也須要排除控制。在區塊鏈網絡中，每一個節點並行地異步操做。此時，要共享的區塊鏈自己的信息不該該不一致。

PoW·PoS中的獨佔控制算法

如第4章所述，分佈式排他控制算法可分爲如下兩種類型。

· 基於Token的解決方案

· 基於權限的解決方案

PoW和PoS是基於權限的，其中，能夠說它是相似於分佈式算法的機制。那麼，您何時得到訪問資源的權限？是的，就在你找到一個隨機數時。

在PoW中，只有當找到在哈希值後跟0後跟n爲0的隨機數時，才能夠執行有效的新塊寫操做。執行操做的礦工將其廣播給全部礦工並分享。

一般，當節點找到一個nonce並建立一個比他本身更早的塊時，minor會同步該信息並移動以搜索下一個nonce值。這是由於若是您使用最長鏈被認爲合法的規則搜索下一個nonce值，它們能夠得到更多利潤。儘管PoS優先爲具備較大硬幣持有量的人提供資源訪問，但基本排除控制算法結構也相似於分佈式算法。

可是，嚴格來講，不執行排除控制。這是爲了在公共時間內同步並造成共識10分鐘，直到下一個區塊爲止。當兩個或更多個節點同時找到隨機數值時，寫入操做以非獨佔狀態執行。此時，因爲只有最長的鏈被認爲是合法的，所以區塊鏈網絡中的信息與時間的流逝保持一致。叉子發生的一個問題是由於沒有執行嚴格的排他控制並且沒有確認最終結果。

BFT類型的獨佔控制算法

另外一方面，經過BFT類型，基於許可的分散算法執行排他控制。該算法解決了分叉和終結問題，這是PoW中與分佈式算法相似的問題。

在BFT類型中，只有一個名爲Proposer，Orderer等的節點有權生成新區塊。建立區塊時，您能夠從全部參與節點收集投票，得到超過2/3的贊成，您纔有權建立新塊。此時，有必要贊成超過2/3而不是多數的緣由是處理拜占庭故障，有關此問題的詳細信息在「分佈式系統中的容錯」一文中有所描述。

在BFT類型算法中，與PoW等不一樣，只有一個節點能夠得到對區塊鏈的獨佔訪問權限，所以不會當即肯定fork和finality。可是，任何人均可以做爲礦工參與網絡的財產每每會丟失。

6–3. 區塊鏈和領導者選擇算法

PoW，PoS和領導者選擇算法

區塊鏈上的領導者選擇算法相似於獨佔控制算法的機制。在比特幣中，用於選舉領導者的算法，即，新建立塊的節點是PoW。

PoW容許添加一個塊做爲一個好的領導者，爲比特幣網絡提供有計算複雜性和發現nonce的節點。每一個成爲領導者的礦工都會嘗試爲比特幣網絡作出貢獻，由於更容易早期同步到首先發現現時的節點並開始搜索下一個塊的現時值更有可能得到獎勵。儘管存在鏈條徹底由硬叉分支的問題，可是經過基於博弈論準備很是簡單的激勵結構，在塊鏈網絡中實現做爲分佈式系統的同步。

在以太坊的狀況下，因爲塊生成的時間很短，所以傾向於發生更多的分叉。關於這一點，經過採用unkle塊的概念，咱們實現了一種結構，即便產生不合法的鏈條也會給予必定的獎勵。

未來引入將來的PoS容許優先生成具備大硬幣保持量的節點的塊做爲引導者。這是一種解決/改善PoW中必要電量變得巨大且易受51％攻擊的問題的算法。這是一種基於博弈論的選舉算法，若是一個節點持有大量硬幣，就不會採起破壞網絡等惡意行爲。

BFT和領導者選擇算法

BFT類型算法的問題在於如何選擇將投票給塊生成的領導者做爲Proposer或Orderer。

在PBFT採起的HyperLedger當中，原爲可信賴的機構纔會註冊爲Orderer。但這是集中式的領導者選擇方法，與分佈式系統存在着明顯的區別。

在Tendermint協議當中，領導者以循環方式被選出，以經過與不一樣驗證者的輪換交替來提出建議。此時，領導候選者是基於PoS，而且能夠說是能夠在分佈式系統中實現領導者選擇的算法之一。