分佈式系統簡介

時間 2021-01-02

標籤 nginx web 算法數據庫服務器架構併發負載均衡框架異步欄目系統架構简体版

原文原文鏈接

什麼是分佈式系統nginx

分佈式系統（distributed system）具備高度的內聚性和透明性。web

內聚性：每個節點高度自治，有本地的數據庫管理系統；算法

透明性：每個數據庫分佈節點對用戶來講是透明的，用戶是感受不到"分佈"的，即用戶不須要知道關係是否分割、有無副本、數據位於哪一個節點、事物在哪一個站點上執行等；數據庫

CAP原理服務器

c：一致性（Consistency）架構

在分佈式系統中的全部數據備份，在同一時刻是否一樣的值；併發

a：可用性（Availability）負載均衡

在集羣中一部分節點故障後，集羣總體是否還能響應客戶端的讀寫請求；框架

p：分區容忍性（Partition Rolerance）異步

分區至關與對通訊的時限要求，消息體若是不能在時限內達成數據一致性，意味着發生了分區的狀況。

所以分區容忍性是基本要求，不然就失去了價值。所以分佈式數據系統，就是在一致性和可用性之間取一個平衡。對於大多數的web應用，並不須要強一致性，一般作法是以強一致性爲代價換取高可用，這也是多數分佈式數據庫產品的方向。

這裏的犧牲一致性，指的是再也不要求關係型數據庫中的強一致性，只要能達到最終一致性便可，這個時間窗口對用戶來講是透明的，用戶是感知不到的。一般的作法，是通過多份異步複製來實現系統的高可用和數據的最終一致性，時間窗口取決於數據複製到一致狀態的時間。

關於最終一致性

一致性問題是由於出現了併發的讀操做或者寫操做。對於客戶端，多進程併發訪問時，更新過的數據在不一樣進程中如何獲取的不一樣策略，決定了不一樣的一致性。

強一致性：對於關係型數據庫，要求更新過的數據能被後續的訪問都能看到；

弱一致性：若是容忍後續的部分或者所有訪問不到，這就是弱一致性；

最終一致性：若是通過一段時間以後，要求可以訪問到更新後的數據，就是最終一致性；

從數據的同步看強弱一致性

對於服務器而言，如何儘快將更新後的數據分佈到整個系統，下降最終一致性的時間窗口，對分佈式系統來講是十分重要的。

咱們假設，如今有一個分佈式系統，數據保存了 N 份，更新數據須要保證寫完成的節點數爲 W ，讀取數據時須要讀取的節點數爲 R ：

若是 W＋R > N, 說明讀寫節點重複，則是強一致性，如一主一備同步複製的關係型數據庫；

若是 W＋R <= N, 則是弱一致性，好比一主一備異步複製的數據庫，讀取備庫，可能沒法讀取主庫已經更新過的數據。

對於分佈式數據庫而言，爲了保證高可用，通常設置 N >= 3。

分佈式系統架構思路

兩種思路

1. 如今有一臺服務器，一臺服務器能夠處理 100w/s 的請求，隨着業務增加，據估算，訪問量最高會達到 200w/s ，若是不進行處理，服務器會拒絕訪問，甚至會出現宕機。最簡單的方案，就是再增長一臺機器（在實際環境中，增長機器來解決問題是經常使用的一種解決方案），每臺機器承擔一半的請求，若是訪問量繼續增長的話，能夠繼續經過增長機器來解決問題。這就是水平擴展。這裏暫時不討論如何進行負載的均衡；

2. 如今有一個應用對外提供項服務，每項服務都是一個請求，當前服務器能夠承擔 100w/s 的請求，目前統計， A 服務 40w/s ， B 服務 40w/s。業務一樣擴大，服務 A 和服務 B 的請求都增長了一倍，有須要進行擴展。使用兩臺機器進行平分，每臺機器承擔服務 A 和服務 B 各一半，平分的話太複雜，不如一臺機器只負責服務 A，亮一臺機器只負責業務 B，這種方式叫作垂直擴展。

簡單對水擴展和垂直擴展進行總結，能夠發現，按照業務進行拆分，便是垂直擴展；按請求進行拆分，即水平擴展。

負載均衡

負載均衡要作的任務，就是肯定客戶端的請求，應該發往分佈式系統中的哪一臺服務器上，一般的作法，就是經過一臺中間服務器，來實現請求的分配。

常見的負載均衡策略：