摘要:隨着數據暴增,單服務器開始疲於應對海量用戶的訪問。自本期《問底》,徐漢彬將帶你們開啓異地跨集羣分佈式系統打造,本次關注的重點則是架構從單機到分佈式集羣的轉變。html
大規模流量的網站架構,歷來都是慢慢「成長」而來。而這個過程當中,會遇到不少問題,在不斷解決問題的過程當中,Web系統變得愈來愈大。而且,新的挑戰又每每出如今舊的解決方案之上。但願這篇文章可以爲技術人員提供必定的參考和幫助。 redis
如下爲原文後端
當一個Web系統從日訪問量10萬逐步增加到1000萬,甚至超過1億的過程當中,Web系統承受的壓力會愈來愈大,在這個過程當中,咱們會遇到不少的問題。爲了解決這些性能壓力帶來問題,咱們須要在Web系統架構層面搭建多個層次的緩存機制。在不一樣的壓力階段,咱們會遇到不一樣的問題,經過搭建不一樣的服務和架構來解決。瀏覽器
Web負載均衡(Load Balancing),簡單地說就是給咱們的服務器集羣分配「工做任務」,而採用恰當的分配方式,對於保護處於後端的Web服務器來講,很是重要。緩存
負載均衡的策略有不少,咱們從簡單的講起哈。服務器
1. HTTP重定向cookie
當用戶發來請求的時候,Web服務器經過修改HTTP響應頭中的Location標記來返回一個新的url,而後瀏覽器再繼續請求這個新url,實際上就是頁面重定向。經過重定向,來達到「負載均衡」的目標。例如,咱們在下載PHP源碼包的時候,點擊下載連接時,爲了解決不一樣國家和地域下載速度的問題,它會返回一個離咱們近的下載地址。重定向的HTTP返回碼是302,以下圖:網絡
若是使用PHP代碼來實現這個功能,方式以下:session
這個重定向很是容易實現,而且能夠自定義各類策略。可是,它在大規模訪問量下,性能不佳。並且,給用戶的體驗也很差,實際請求發生重定向,增長了網絡延時。架構
2. 反向代理負載均衡
反向代理服務的核心工做主要是轉發HTTP請求,扮演了瀏覽器端和後臺Web服務器中轉的角色。由於它工做在HTTP層(應用層),也就是網絡七層結構中的第七層,所以也被稱爲「七層負載均衡」。能夠作反向代理的軟件不少,比較常見的一種是Nginx。
Nginx是一種很是靈活的反向代理軟件,能夠自由定製化轉發策略,分配服務器流量的權重等。反向代理中,常見的一個問題,就是Web服務器存儲的session數據,由於通常負載均衡的策略都是隨機分配請求的。同一個登陸用戶的請求,沒法保證必定分配到相同的Web機器上,會致使沒法找到session的問題。
解決方案主要有兩種:
反向代理服務,也是能夠開啓緩存的,若是開啓了,會增長反向代理的負擔,須要謹慎使用。這種負載均衡策略實現和部署很是簡單,並且性能表現也比較好。可是,它有「單點故障」的問題,若是掛了,會帶來不少的麻煩。並且,到了後期Web服務器繼續增長,它自己可能成爲系統的瓶頸。
3. IP負載均衡
IP負載均衡服務是工做在網絡層(修改IP)和傳輸層(修改端口,第四層),比起工做在應用層(第七層)性能要高出很是多。原理是,他是對IP層的數據包的IP地址和端口信息進行修改,達到負載均衡的目的。這種方式,也被稱爲「四層負載均衡」。常見的負載均衡方式,是LVS(Linux Virtual Server,Linux虛擬服務),經過IPVS(IP Virtual Server,IP虛擬服務)來實現。
在負載均衡服務器收到客戶端的IP包的時候,會修改IP包的目標IP地址或端口,而後原封不動地投遞到內部網絡中,數據包會流入到實際Web服務器。實際服務器處理完成後,又會將數據包投遞迴給負載均衡服務器,它再修改目標IP地址爲用戶IP地址,最終回到客戶端。
上述的方式叫LVS-NAT,除此以外,還有LVS-RD(直接路由),LVS-TUN(IP隧道),三者之間都屬於LVS的方式,可是有必定的區別,篇幅問題,不贅敘。
IP負載均衡的性能要高出Nginx的反向代理不少,它只處理到傳輸層爲止的數據包,並不作進一步的組包,而後直接轉發給實際服務器。不過,它的配置和搭建比較複雜。
4. DNS負載均衡
DNS(Domain Name System)負責域名解析的服務,域名url其實是服務器的別名,實際映射是一個IP地址,解析過程,就是DNS完成域名到IP的映射。而一個域名是能夠配置成對應多個IP的。所以,DNS也就能夠做爲負載均衡服務。
這種負載均衡策略,配置簡單,性能極佳。可是,不能自由定義規則,並且,變動被映射的IP或者機器故障時很麻煩,還存在DNS生效延遲的問題。
5. DNS/GSLB負載均衡
咱們經常使用的CDN(Content Delivery Network,內容分發網絡)實現方式,其實就是在同一個域名映射爲多IP的基礎上更進一步,經過GSLB(Global Server Load Balance,全局負載均衡)按照指定規則映射域名的IP。通常狀況下都是按照地理位置,將離用戶近的IP返回給用戶,減小網絡傳輸中的路由節點之間的跳躍消耗。
圖中的「向上尋找」,實際過程是LDNS(Local DNS)先向根域名服務(Root Name Server)獲取到頂級根的Name Server(例如.com的),而後獲得指定域名的受權DNS,而後再得到實際服務器IP。
CDN在Web系統中,通常狀況下是用來解決大小較大的靜態資源(html/Js/Css/圖片等)的加載問題,讓這些比較依賴網絡下載的內容,儘量離用戶更近,提高用戶體驗。
例如,我訪問了一張imgcache.gtimg.cn上的圖片(騰訊的自建CDN,不使用qq.com域名的緣由是防止http請求的時候,帶上了多餘的cookie信息),我得到的IP是183.60.217.90。
這種方式,和前面的DNS負載均衡同樣,不只性能極佳,並且支持配置多種策略。可是,搭建和維護成本很是高。互聯網一線公司,會自建CDN服務,中小型公司通常使用第三方提供的CDN。