在阿里「救了八年火」的程序猿，這樣講述大型項目架構演進過程

時間 2019-11-26

標籤阿里救了八年 8年程序這樣講述大型項目架構演進過程欄目阿里巴巴简体版

原文原文鏈接

高大上的淘寶架構

上面是一些安全體系系統，如數據安全體系、應用安全體系、前端安全體系等。前端

中間是業務運營服務系統，如會員服務、商品服務、店鋪服務、交易服務等。java

還有共享業務，如分佈式數據層、數據分析服務、配置服務、數據搜索服務等。面試

最下面呢，是中間件服務，如MQS即隊列服務，OCS即緩存服務等。算法

圖中也有一些看不到，例如高可用的一個體現，實現雙機房容災和異地機房單元化部署，爲淘寶業務提供穩定、高效和易於維護的基礎架構支撐。數據庫

這是一個含金量很是高的架構，也是一個很是複雜而龐大的架構。固然這個也不是一天兩天演進成這樣的，也不是一上來就設計並開發成這樣高大上的架構的。後端

這邊就要說一下，小型公司要怎麼作呢？對不少創業公司而言，很難在初期就預估到流量十倍、百倍以及千倍之後網站架構會是什麼樣的一個情況。同時，若是系統初期就設計一個千萬級併發的流量架構，很難有公司能夠支撐這個成本。瀏覽器

所以，一個大型服務系統都是從小一步一步走過來的，在每一個階段，找到對應該階段網站架構所面臨的問題，而後在不斷解決這些問題，在這個過程當中整個架構會一直演進。緩存

那咱們來一塊兒看一下。安全

單服務器-俗稱all in one

從一個小網站提及，一臺服務器也就足夠了，文件服務器，數據庫，還有應用都部署在一臺機器，俗稱ALL IN ONE服務器

隨着咱們用戶愈來愈多，訪問愈來愈大，硬盤，CPU，內存等都開始吃緊，一臺服務器已經知足不了，這個時候看一下下一步演進

數據服務與應用服務分離

咱們將數據服務和應用服務分離，給應用服務器配置更好的 CPU，內存。而給數據服務器配置更好更大的硬盤。

分離以後提升必定的可用性，例如Files Server掛了，咱們仍是能夠操做應用和數據庫等。

隨着訪問qps愈來愈高，下降接口訪問時間，提升服務性能和併發，成爲了咱們下一個目標，發現有不少業務數據不須要每次都從數據庫獲取。

使用緩存，包括本地緩存，遠程緩存，遠程分佈式緩存

由於 80% 的業務訪問都集中在 20% 的數據上，也就是咱們常常說的28法則。若是咱們能將這部分數據緩存下來，性能一會兒就上來了。而緩存又分爲兩種：本地緩存和遠程緩存緩存，以及遠程分佈式緩存，咱們這裏面的遠程緩存圖上畫的是分佈式的緩存集羣(Cluster)。

思考的點

具備哪一種業務特色數據使用緩存？
具備哪一種業務特色的數據使用本地緩存？
具備哪一種務特色的數據使用遠程緩存？
分佈式緩存在擴容時候會碰到什麼問題？如何解決？分佈式緩存的算法都有哪幾種？各有什麼優缺點？

這個時候隨着訪問qps的提升，服務器的處理能力會成爲瓶頸。雖然是能夠經過購買更強大的硬件，但總會有上限，並且這個到後期成本就是指數級增加了，這時，咱們就須要服務器的集羣。須要使咱們的服務器能夠橫向擴展，這時，就必須加個新東西：負載均衡調度服務器。

使用負載均衡，進行服務器集羣

增長了負載均衡，服務器集羣以後，咱們能夠橫向擴展服務器，解決了服務器處理能力的瓶頸。

思考的點

負載均衡的調度策略都有哪些？
各有什麼優缺點？
各適合什麼場景？

打個比方，咱們有輪詢，權重，地址散列，地址散列又分爲原ip地址散列hash，目標ip地址散列hash，最少鏈接，加權最少鏈接，還有繼續升級的不少種策略......咱們一塊兒來分析一下

典型負載均衡策略分析

輪詢：優勢：實現簡單，缺點：不考慮每臺服務器處理能力
權重：優勢：考慮了服務器處理能力的不一樣
地址散列：優勢：能實現同一個用戶訪問同一個服務器
最少鏈接：優勢：使集羣中各個服務器負載更加均勻
加權最少鏈接：在最少鏈接的基礎上，爲每臺服務器加上權值。算法爲(活動鏈接數*256+非活動鏈接數)/權重，計算出來的值小的服務器優先被選擇。

繼續引出問題的場景：

咱們的登陸的時候登陸了A服務器，session信息存儲到A服務器上了，假設咱們使用的負載均衡策略是ip hash，那麼登陸信息還能夠從A服務器上訪問，可是這個有可能形成某些服務器壓力過大，某些服務器又沒有什麼壓力，這個時候壓力過大的機器(包括網卡帶寬)有可能成爲瓶頸，而且請求不夠分散。

這時候咱們使用輪詢或者最小鏈接負載均衡策略，就致使了，第一次訪問A服務器，第二次可能訪問到B服務器，這個時候存儲在A服務器上的session信息在B服務器上讀取不到。

Session管理-Session Sticky粘滯會話：

打個比方就是若是咱們每次吃飯都要保證咱們用的是本身的碗筷，而只要咱們在一家飯店裏存着咱們的碗筷，只要咱們每次去這家飯店吃飯就行了。

對於同一個鏈接中的數據包，負載均衡會將其轉發至後端固定的服務器進行處理。

解決了咱們session共享的問題，可是它有什麼缺點呢？

一臺服務器運行的服務掛掉，或者重啓，上面的 session 都沒了負載均衡器成了有狀態的機器，爲之後實現容災形成了羈絆

Session管理-Session 複製

就像咱們在全部的飯店裏都存一份本身的碗筷。咱們隨意去哪一家飯店吃飯都OK，不適合作大規模集羣，適合機器很少的狀況。

解決了咱們session共享的問題，可是它有什麼缺點呢？

應用服務器間帶寬問題，由於須要不斷同步session數據大量用戶在線時，服務器佔用內存過多

Session管理-基於Cookie

打個比方，就是咱們每次去飯店吃飯，都本身帶着本身的碗筷。

解決了咱們session共享的問題，可是它有什麼缺點呢？

cookie 的長度限制 cookie存於瀏覽器，安全性是一個問題

Session管理-Session 服務器

打個比方，就是咱們的碗筷都存在了一個龐大的櫥櫃裏，咱們去任何一家飯店吃飯，均可以從櫥櫃中拿到屬於咱們本身的碗筷。

解決了咱們session共享的問題，這種方案須要思考哪些問題呢？

保證 session 服務器的可用性，session服務器單點如何解決？咱們在寫應用時須要作調整存儲session的業務邏輯打個比方，咱們爲了提升session server的可用性，能夠繼續給session server作集羣

中間總結

因此說，網站架構在遇到某些指標瓶頸時，演進的過程當中，都有哪些解決方案，他們都有什麼優缺點？業務功能上如何取捨？如何作出選擇？這個過程纔是最重要的。

在解決了橫向擴展應用服務器以後，那咱們繼續~~

針對上面的技術我特地整理了一下，有不少技術不是靠幾句話能講清楚，因此乾脆找朋友錄製了一些視頻，不少問題其實答案很簡單，可是背後的思考和邏輯不簡單，要作到知其然還要知其因此然。若是想學習Java工程化、高性能及分佈式、深刻淺出。微服務、Spring，MyBatis，Netty源碼分析的朋友能夠加個人Java進階羣：680130298，羣裏有阿里大牛直播講解技術，以及Java大型互聯網技術的視頻免費分享給你們。

繼續回到目前架構圖

數據庫的讀及寫操做都還須要通過數據庫。當用戶量達到必定量，數據庫將會成爲瓶頸。那咱們如何來解決呢？

數據庫讀寫分離

使用數據庫提供的熱備功能，將全部的讀操做引入slave 服務器，由於數據庫的讀寫分離了，因此，咱們的應用程序也得作相應的變化。咱們實現一個數據訪問模塊(圖中的data access module)使上層寫代碼的人不知道讀寫分離的存在。這樣多數據源讀寫分離就對業務代碼沒有了侵入。這裏就引出了代碼層次的演變

思考的點