大型網站架構模式

  什麼是模式?這個來自建築學的詞彙是這樣定義的:「每個模式描述定義了一個在咱們周圍不斷重複發生的問題及該問題解決方案的核心。這樣,你就能一次又一次地使用該方案而沒必要作重複的工做」。模式的關鍵在於模式的可重複性,問題與場景的可重複性帶來解決方案的可重複使用。前端

網站的架構模式

一、分層

分層是企業應用系統中最多見的一種架構模式,將系統在橫向維度上切分紅幾個部分,每一個部分負責一部分相對比較單一的職責,而後經過上層對下層的依賴和調用組成一個完整的系統。這裏個人理解是 就像是 Service 層調用 DAO 層,而後 DAO 再去操做數據庫這樣。mysql

分層的優勢:能夠更好的將一個龐大的軟件系統切分紅不一樣的部分,便於分工合做開發和維護;各層之間具備必定的獨立性,只要維持調用接口不變,各層能夠根據具體問題獨立演化發展而不須要其餘層必須作出相應調整。git

分層也有一些挑戰:必須合理規劃層次邊界和接口,在開發過程當中,嚴格遵循分層架構的約束,禁止跨層次的調用(應用層直接調用數據層)及逆向調用(數據層調用服務層或者服務層調用應用層)。算法

分層架構是邏輯上的,在物理部署上,三層結構能夠部署在同一臺物理機上,但隨着業務發展,必然須要對已經分層的模塊分離部署。分層結構對網站支持高併發向分佈式方向發展相當重要。所以在網站規模還很小的時候就應該採用分層的架構,這樣未來網站作大時才能更好的應對。sql

二、分割

網站越大,功能越複雜,服務和數據處理的種類也越多,將這些不一樣的功能和服務分割開來,包裝成 高內聚低耦合 的 模塊單元,一方面有助於軟件的開發和維護;另外一方面,便於不一樣模塊的分佈式部署,提升網站的併發處理能力和功能擴展能力。數據庫

三、分佈式

對於大型網站,分層和分割的一個主要目的是爲了切分後的模塊便於分佈式部署,即將不一樣模塊部署在不一樣的服務器上,經過遠程調用協同工做。後端

分佈式優勢:可使用更多的計算機完成一樣的功能,計算機越多,CPU、內存、存儲資源也就越多,可以處理的併發訪問和數據量就越大。瀏覽器

但分佈式在解決網站高併發問題的同時也帶來了其餘問題:緩存

a. 分佈式意味着服務調用必須經過網絡,可能會對性能形成比較嚴重的影響;安全

b. 服務器越多,其宕機的機率也就越大,一臺服務器宕機形成的服務不可用可能會致使不少應用不可訪問,是網站可用性下降;

c. 數據在分佈式的環境中保持數據一致性也很是困難,分佈式事務也難以保證,這對網站業務正確性和業務流程有可能形成很大影響;

d. 分佈式還致使網站依賴錯綜複雜,開發管理維護困難。

經常使用的分佈式方案有如下幾種:

A. 分佈式應用和服務:將分層和分割後的應用和服務模塊分佈式部署,除了能夠蓋上網站性能和併發性、加快開發和發佈速度、減小數據庫鏈接資源消耗外;還可使不一樣應用複用共同的服務,分佈式靜態資源:網站的靜態資源如 JS、CSS、Logo 圖片等資源獨立分佈式部署,並採用獨立的域名。靜態資源分佈式部署能夠減輕應用服務器的負載壓力;經過使用獨立域名加快瀏覽器併發加載的速度;由負責用戶體驗的團隊進行開發維護有利於網站分工合做,使不一樣技術工種術業有專攻。業務功能擴展。

B. 分佈式靜態資源:網站的靜態資源如 JS、CSS、Logo 圖片等資源獨立分佈式部署,並採用獨立的域名。靜態資源分佈式部署能夠減輕應用服務器的負載壓力;經過使用獨立域名加快瀏覽器併發加載的速度;由負責用戶體驗的團隊進行開發維護有利於網站分工合做,使不一樣技術工種術業有專攻。

C. 分佈式數據和存儲:大型網站須要處理以P爲單位的海量數據,單臺計算機沒法提供如此大的存儲空間,須要分佈式存儲。除了對傳統的關係型數據庫進行分佈式部署外,爲網站應用而生的各類NoSQL產品幾乎都是分佈式的。

D. 分佈式計算:目前網站廣泛使用 Hadoop 及其 MapReduce 分佈式計算框架進行批處理計算,其特色是移動計算而不是移動數據,將計算程序分發到數據所在的位置以加速計算和分佈式計算。

此外,還有能夠支持網站線上服務器配置實時更新的分佈式配置;分佈式環境下實現併發和協同的分佈式鎖;支持雲存儲的分佈式文件系統。

四、集羣

使用分佈式雖然已經將分層和分割後的模塊獨立部署,可是對於用戶訪問幾種的模塊(好比首頁),還須要將獨立部署的服務器集羣化,即多臺服務器部署相同應用構成一個集羣,經過負載均衡設備共同對外提供服務。

集羣優勢:

a. 由於服務器集羣有更多的服務器提供相同服務,所以能夠提供更好的併發特性,當有更多用戶訪問的時候,只須要向集羣中加入新機器便可。

b. 當某臺服務器發生故障時,負載均衡設備或者系統的失效轉移機制會將請求轉發到集羣中其餘服務器上,不影響用戶使用。

因此在網站應用中,即便是訪問量很小的分佈式應用和服務,也至少要部署兩臺服務器構成一個小的集羣,以提升系統的可用性。

五、緩存

緩存就是將數據存放在距離計算機最近的的位置以加快處理速度,緩存是改善軟件性能的第一手段。

CDN:即內容分發網絡(Content Distribute Network),部署在距離終端用戶最近的網絡服務商,用戶的網絡請求老是先到達他的網絡服務商那裏,在這裏緩存網站的一些靜態資源(較少變化的數據),能夠就近以最快速度返回給用戶。

反向代理:反向代理屬於網站前端架構的一部分,部署在網站的前端,當用戶請求到達網站的數據中心時,最早訪問到的就是反向代理服務器,這裏緩存網站的靜態資源,無需將請求繼續轉發給應用服務器就能返回給用戶。

本地緩存:在應用服務器本地緩存這熱點數據,應用程序能夠在本機內存中直接訪問數據,而無需訪問數據庫。

分佈式緩存:大型網站的數據量很是龐大,除了本地緩存,還須要分佈式緩存,將數據緩存在一個專門的分佈式緩存集羣中,應用程序經過網路通訊訪問緩存數據。緩存除了能夠加快數據訪問速度,還能夠減輕後端應用和數據存儲的負載壓力。

使用緩存有兩個前提條件:

a. 數據訪問熱點不均衡,某些數據會被更頻繁的訪問,應該放在緩存中

b. 數據在某個時間段內有效,不會很快過時,不然緩存的數據就會因已經失效而產生髒讀,影響結果的正確性。

六、異步

在大型網站的架構中,系統解耦的手段除了前面提到的分層、分割、分佈式等,還有一個重要的手段就是異步。業務之間的消息傳遞不是同步調用,而是將一個業務操做分紅多個階段,每一個階段之間經過共享數據的方式異步執行進行協做。

在單一服務器內部可經過多線程共享內存隊列的方式實現異步,處在業務操做前面的線程將輸出寫入到隊列,後面的線程從隊列中讀取數據進行處理;在分佈式系統中,多個服務器集羣經過分佈式消息隊列實現異步,分佈式消息隊列能夠看做內存隊列的分佈式部署。

異步架構是典型的生產者消費者模式,二者不存在直接調用,只要保持數據結構不變,彼此功能實現能夠隨意變化而不互相影響。

異步消息隊列有如下特性:

提升系統可用性:消費者服務器發生故障,數據會在消息隊列服務器中存儲堆積,生產者服務器能夠繼續處理業務請求,系統總體表現無端障。消費者服務器恢復正常後,繼續處理消息隊列中的數據。

加快網站響應速度:在處理業務前端的生產者服務器在處理完請求後,將數據寫入消息隊列,不須要等待消費者服務器處理就能夠返回,響應延遲減小。

消除併發訪問高峯:網站的促銷活動、微博熱點事件,均可能形成網站併發訪問忽然增大,可能會形成整個網站負載太重,響應延遲甚至服務宕機。使用消息隊列將忽然增長的訪問請求數據放入消息隊列中,等待消費者服務器依次處理,就不會對整個網站負載形成太大壓力。

須要注意的是:使用異步方式處理業務可能會對用戶體驗、業務流程形成影響。

七、冗餘

網站須要 7x24小時連續運行,可是服務器宕機隨時可能出現故障,特別是服務器規模比較大時,出現某臺服務器宕機是必然事件。要想保證在服務器宕機的狀況下網站依然能夠繼續服務,不丟失數據,就須要必定程度的服務器冗餘運行,數據冗餘備份,這樣當某臺服務器宕機時,能夠將其上的服務和數據訪問轉移到其餘機器上。

上面說過,即便訪問和負載很小的服務也必須部署至少兩臺服務器構成一個集羣,目的就是經過冗餘實現服務器高可用。數據庫除了按期備份,存檔保存,實現冷備份外,爲了保證在線業務高可用,還須要對數據庫進行主從分離,實時同步實現熱備份。

爲了抵禦地震、海嘯等不可抗力致使的網站徹底癱瘓,某些大型網站會對整個數據中心進行備份,全球範圍內部署 災備數據中心

八、自動化

發佈對網站都是頭等大事,許多網站故障出在發佈環節,網站工程師常常加班也是由於發佈不順利。經過減小人爲干預,是發佈過程自動化可有效減小故障。發佈過程包括諸多環節。自動化代碼管理,代碼版本控制、代碼分支建立合併等過程自動化,開發工程師只要提交本身參與開發的產品代號,系統就會自動爲其建立開發分支,後期會自動進行代碼合併;自動化測試自動化安全檢測;最後進行自動化部署

此外,網站在運行過程當中可能會遇到各類問題:服務器宕機、程序Bug、存儲空間不足、忽然爆發的訪問高峯。網站須要對線上生產環境進行自動化監控,對服務器進行心跳檢測,並監控其各項性能指標和應用程序的關鍵數據指標。若是發現異常、超出預設的閾值,就進行自動化報警,向相關人員發送報警信息,警告故障可能會發生。在檢測到故障發生後,系統會進行自動化失效轉移,將失效的服務器從集羣中隔離出去,再也不處理系統中的應用請求。待故障消除後,系統進行自動化失效恢復,從新啓動服務器,同步數據保證數據的一致性。在網站遇到訪問高峯,超出網站最大處理能力時,爲了保障整個網站的安全可用,還會進行自動化降級,經過拒絕部分請求及關閉部分不重要的服務將整個系統負載降至一個安全的水平,必要時還須要自動化分配資源,將空閒資源分配給重要的服務,擴大其部署規模。

九、安全

互聯網在安全架構方面也積累了許多模式:經過密碼手機校驗碼進行身份認證;登錄、交易等操做須要對網絡通訊進行加密,網站服務器上存儲的敏感數據如用戶信息等也進行加密處理;爲了防止機器人程序濫用網絡資源攻擊網站,網站使用驗證碼進行識別;對於常見的用於攻擊網站的XSS攻擊、SQL注入,進行編碼轉換等相應的處理;對於垃圾信息、敏感信息進行過濾;對交易轉帳等重要操做根據交易模式和交易信息進行風險控制

架構模式應用

通常系統分爲三個層次,最下層是基礎服務層,提供數據庫、緩存、存儲、搜索等數據服務,以及其餘一些基礎技術服務,這些服務支撐了業務海量數據和高併發訪問,是整個系統的技術基礎。

中間層是平臺服務和應用服務層,這些服務被分割爲獨立的服務模塊,經過依賴調用和共享基礎數據構成整個的業務基礎。

最上層是API和各類應用的業務層,各類客戶端和第三方應用,經過調用API集成到系統中,共同組成一個生態系統。

這些被分層和分割後的業務模塊與基礎技術模塊分佈式部署,每一個模塊都部署在一組獨立的服務器集羣上,經過遠程調用的方式進行依賴訪問。 

相關文章
相關標籤/搜索