大型網站技術架構-2. 大型網站架構模式

  1. 分層前端


  分層是企業應用中最多見的一種架構模式,將系統在橫向維度上切分爲幾個部分,每一個部分負責一部分相對比較單一的職責,而後經過上層對下層的依賴和調用組成一個完整的系統。數據庫


  在大型網站架構中也採用分層結構,將網站軟件系統分爲:應用層、服務層、數據層後端


·應用層:負責具體的業務和視圖展現,如網站首頁及搜索輸入和結果展現;瀏覽器

·服務層:爲應用層提供服務支持,如用戶管理服務,購物車服務;緩存

·數據層:提供數據存儲訪問服務,如數據庫、緩存、文件、搜索等;安全


  分層架構必須合理規劃層次邊界和接口,在開發過程當中,嚴格遵循分層架構的約束,禁止跨層次的調用(應用層直接調用數據層)及逆向調用(數據層調用服務層,或者服務層調用應用層)。三層結構分別部署在不一樣的服務器上,使網站擁有更多的計算資源以及愈來愈多的用戶訪問。在網站的發展過程當中,分層結構對網站支持高併發向分佈式方向發展相當重要。所以在網站規模還很小的時候就採用分層結構,這樣未來網站作大時才能更好的應對。服務器



2. 分割網絡


   網站越大,功能越複雜,服務和數據處理的種類越多,講這些不一樣的功能和服務分割開來,包裝成高內聚低耦合的模塊單元,一方面有助於軟件的開發和維護;另外一方面,便於不一樣模塊的分佈式部署,提升網站的併發處理能力和功能擴展能力。數據結構



3. 分佈式多線程


   對於大型網站,分層和分割的一個主要的目的是爲了切分後的模塊便於分佈式部署,即將不一樣模塊部署在不一樣的服務器上,經過遠程調用協同工做。分佈式意味着可使用更多的計算機完成相同的功能,計算機越多,cpu、內存、存儲資源也就越多,可以處理的併發訪問和數據量就越大,進而可以爲更多的用戶提供服務。


  分佈式在解決網站高併發問題的同時也帶來了其餘問題:


1)分佈式意味着服務調用必須經過網絡,這可能會對性能形成比較嚴重的影響

2)服務器越多,服務器宕機的機率也就越大,一臺服務器宕機形成的服務不可用可能會致使不少應用不可訪問,使網站可用性下降

3)數據在分佈式的環境中保持數據一致性也很是困難分佈式事務也難以保證,這對網站業務的正確性和業務流程可能形成很大的影響;

4)分佈式致使網站依賴錯綜複雜開發管理維護困難


  在網站應用中,經常使用的分佈式方案有如下幾種:

·分佈式應用和服務:將分層和分割後的應用和服務模塊分佈式部署,能夠改善網站性能和併發性、加快開發和發佈速度、減小數據庫鏈接資源消耗外,還可使不一樣的應用複用共同的服務,便於業務功能擴展;

·分佈式靜態資源:網站的靜態資源如JS、CSS、logo圖片等資源獨立分佈式部署,並採用獨立的域名,即動靜分離。靜態資源分佈式部署能夠減輕應用服務器的負載壓力;經過使用獨立域名加快瀏覽器併發加載的速度。

·分佈式數據和存儲:對於海量數據,單臺計算機無法提供如此大的存儲空間,這些數據須要分佈式存儲。爲網站應用而生的各類NoSQL產品幾乎都是分佈式的。

·分佈式計算:目前網站廣泛使用Hadoop以及MapReduce分佈式計算框架進行計算。

  

  此外,還有能夠支持網站線上服務器配置實時更新的分佈式配置;分佈式環境下實現併發和協調的分佈式鎖;支持雲存儲的分佈式文件系統等;


4. 集羣


  使用分佈式雖然已經將分層和分割後的模塊獨立化部署,可是對於用戶訪問集中的模塊,還須要將獨立部署的服務器集羣化,即多臺服務器部署相同應用構成一個集羣,經過負載均衡設備共同對外提供服務


  由於服務器集羣有更多服務器提供相同服務,所以能夠提供更好的併發性。當有更多用戶訪問的時候,只須要向集羣中加入新的機器便可。由於一個應用由多態服務器提供,當某臺服務器發生故障時,負載均衡設備將請求轉發到集羣中其餘服務器上,使服務器故障不影響用戶使用。因此在網站應用中,即便是訪問量很小的分佈式應用和服務,也至少要部署兩臺服務器構成一個小的集羣,目的是提升系統的可用性。


5. 緩存


  大型網站架構設計在不少方面都是用了緩存設計:

·CDN:即內容分發網絡,部署在距離終端用戶最近的網絡服務商,用戶的網絡請求老是先到達他的網絡服務商哪裏,在這裏緩存網站的一些靜態資源,能夠就近以最快的速度返回給用戶,如視頻網站和門戶網站會將訪問量大的熱點內容緩存在CDN。

·反向代理:反向代理屬於網站前端架構的一部分,部署在網站的前端,當用戶請求到達網站的數據中心時,最早訪問到的是反向代理服務器,這裏緩存網站的靜態資源,無需將請求繼續轉發給應用服務器就能返回給用戶。

·本地緩存:在應用服務器本地緩存着熱點數據,應用程序能夠在本機內存中直接訪問數據,而無需訪問數據庫。

·分佈式緩存:大型網站的數據量很是龐大,即便只緩存一小部分,須要的內存空間也不是單機能承受的,因此除了本地緩存,還須要分佈式緩存,將數據緩存在一個專門的分佈式緩存集羣中,應用程序經過網絡通訊訪問緩存數據



  使用緩存有兩個前提條件,一是數據訪問熱點不均衡,某些數據會被更頻繁的訪問,這些數據應該放在緩存中;二是數據在某個時間段內有效,不會很快過時,不然緩存的數據就會因已經失效而產生髒讀,影響結果的正確性。網站應用中,緩存除了能夠加快數據訪問速度,還能夠減輕後端應用和數據存儲的負載壓力,這一點對網站數據庫架構相當重要,網站數據庫幾乎都是按照有緩存的前提進行負載能力設計的。



6. 異步


  在大型網站架構中,系統解耦合的手段除了前面提到的分層、分割、分佈等,還有一個重要的手段是異步,業務之間的消息傳遞不是同步調用,而是將一個業務操做分紅多個階段,每一個階段之間經過共享數據的方式異步執行進行協做


  在單一服務器內部可經過多線程共享內存隊列的方式實現異步,處在業務操做前面的線程將輸出寫入到隊列,後面的線程從隊列中讀取數據進行處理;

  在分佈式系統中,多個服務器集羣經過分佈式消息隊列實現異步,分佈式消息隊列能夠看作內存隊列的分佈式部署。


  異步架構是典型的生產者消費者模式,二者不存在直接調用,只要保持數據結構不變,彼此功能實現能夠隨意變化而不相互影響,這對網站擴展新功能很是便利。除此以外,使用異步消息隊列還有以下特性:

·提升系統的可用性:消費者服務器發生故障,數據會在消息隊列服務器中存儲堆積,生產者服務器能夠繼續處理業務請求,系統總體表現無端障。消費者服務器恢復正常後,繼續處理消息隊列中的數據。

·加快網站響應速度:處在業務處理前端的生產者服務器在處理完業務請求後,將數據寫入消息隊列,不須要等待消費者服務器處理就能夠返回,響應延遲減小。

·消除併發訪問高峯:使用消息隊列將忽然增長的訪問請求數據放到消息隊列中,等待消費者服務器依次處理,就不會對整個網站負載形成太大的壓力。

  

  但須要注意的是,使用異步方式處理業務可能會對用戶體驗、業務流程形成影響,須要網站產品設計方面的支持。



7. 冗餘


  網站須要7x24小時連續運行,可是服務器隨時可能出現故障,特別是服務器規模比較大時,出現某臺服務器宕機是必然事件。想要保證在服務器宕機的狀況下網站依然能夠繼續服務,不丟失數據,就須要必定程度的服務器冗餘運行,數據冗餘備份,這樣當某臺服務器宕機時,能夠將其上的服務和數據訪問轉移到其餘機器上。


  訪問和負載很小的服務也必須部署至少兩臺服務器構成一個集羣,其目的就是經過冗餘實現服務高可用。數據庫除了按期備份,存檔保存,實現冷備份外,爲了保證在線業務高可用,還須要對數據庫進行主從分離,實時同步實現熱備份。


8. 自動化



9. 安全


----新浪微博平臺架構

http://blog.jobbole.com/83459/

相關文章
相關標籤/搜索