甩掉運維黑鍋,容災部署如何破?後端
現現在本地負載均衡技術已經解決服務器集羣的高可用問題,可是斷電、施工挖斷光纜、天然災害等依然能夠致使整個數據中心沒法工做。緩存
另外,中國網絡由多家運營商組成,各運營商之間互聯互通質量差已經是不爭的事實。服務器
所以大型互聯網企業早已不知足於單1、或者雙活數據中心提供網站服務,愈來愈多的互聯網企業開始考慮在不一樣地區、不一樣運營商部署多個數據中心集羣,以實現用戶訪問就近接入、負載均衡和故障容災。網絡
提到多數據中心部署,就不可避免須要面對如下三個問題。負載均衡
l 多個數據中心流量如何分配?運維
l 監控怎樣及時發現網絡故障?分佈式
l 多個數據中心服務如何容災?測試
若是這三個問題不能有效解決,將會致使用戶訪問質量差、服務黑洞、以及客戶的投訴。而網站背後的運維人員,則會頻繁受到銷售、PM、領導的Challenge!淪爲背黑鍋的對象。網站
使人欣喜的是,阿里雲產品雲解析DNS,現已助力中小企業解決多數據中心的流量負載均衡、實現用戶就近接入、故障及時發現和實時容災切換。阿里雲
在多個數據中心部署服務時,必然須要面對不一樣數據中心接入帶寬不一樣、服務器集羣負載能力不一樣、以及運營成本等諸多因素。因此須要針對不一樣的因素設計與之相匹配的流量分配比例,那麼如何可以精確的分配訪問流量呢?雲解析DNS爲您提供了一些參考方案。
雲解析DNS是一款通過特殊設計的智能DNS系統,能快速識別出IP地址所在的位置信息(包括國家、省、市和運營商等),並能夠向不一樣來源的DNS查詢響應不一樣的IP地址,實現企業就近接入、下降跨網流量的需求、以及灰度發佈等需求。
同時,針對相同位置不一樣服務能力的數據中心集羣,能夠經過WRR(Weighted Resource Record)來設置總體流量分配方案。
例如:example.com公司的www官網,有6個數據中心,其中華北電信兩個、華東聯通兩個、另外兩個託管在阿里雲BGP數據中心,如圖一所示。
圖一
1. 華東聯通兩個數據中心的帶寬比例是3 :7,經過雲解析設置線路內負載均衡時,將兩個數據中心服務IP地址的權重分別設置成3和7, 達到華東聯通訪問流量按照30%和70%分配的比例;
2. 華北電信兩個數據中心的帶寬比例是1 :1,經過雲解析設置線路內負載均衡時,將兩個數據中心服務IP地址的權重分別設置成1,達到各佔華北電信訪問流量50%的配置比例;
3. 阿里雲BGP 兩個Region的ECS數量比例是8 :2,那經過雲解析設置線路內負載均衡時,將兩個Region公網彈性IP地址的權重分別設置成8和2, 達到訪問流量按照80%和20%分配的比例;
4. 網絡監控對各個數據中心的服務IP進行實時監控;
5. 網絡監控週期性將監控結果反饋給雲解析DNS;
6. 用戶向華北電信dns發起www.example.com DNS查詢請求;
7. 華北電信dns收到用戶的查詢後若是沒有緩存該域名,則向雲解析DNS發起域名查詢;
8. 雲解析DNS收到華北電信的DNS查詢時,輪詢響應IP地址3.3.3.3和4.4.4.4。此時一半華北電信DNS獲得的結果時3.3.3.3,另半華北電信DNS獲得的結果時4.4.4.4。
同理,雲解析DNS收到華東聯通的DNS查詢時,先連續返回3次5.5.5.5,再連續返回7次6.6.6.6,而後重複執行,此時30%的華東聯通DNS獲得的結果是3.3.3.3,剩下70%獲得的結果是4.4.4.4。
9. 華北電信DNS收到雲解析DNS的響應後會緩存域名解析結果,並返回給最終查詢用戶。
10. 最終實現50%的華北電信用戶訪問3.3.3.3上的網站服務,另外50%華北電信用戶訪問4.4.4.4上的網站服務。
1. 雲解析DNS在經過智能解析和WRR幫助中小企業實現就近訪問以及流量分配的同時,有效的結合阿里雲分佈式監控,利用全網撥測探針對網站的解析記錄進行實時監控,如圖二。
圖二
2. 雲解析DNS的網絡監控目前已支持HTTP/HTTPS、自定義URL、在提供5個真實阿里巴巴撥測節點基礎上,優選了15個三大運營商優質撥測點。同時多達50個監控任務數的配置全面領先競爭對手,確保可以及時發現宕機故障,增大監控覆蓋面,如圖三。
圖三
3. 低至1分鐘的監控頻率,至關於您的網站每3秒鐘,就能夠得到一次健康檢測,最快能夠宕機後3分鐘內檢測出故障,並經過全球負載均衡功能完成故障切換。
4. 爲了防止誤報警現象發生,咱們將宕機判斷閾值設置爲50%,即50%的節點監控異常時斷定爲宕機故障。
5. 固然DNS生效還受到運營商緩存TTL的影響,建議設置主機記錄TTL爲60秒。
6. 若是你是移動端開發者,推薦配合阿里雲HTTPDNS服務同時使用,故障切換更加靈敏。
Ø 故障隔離
在網站服務運行的過程當中,故障不可避免總會發生。那麼如何作好故障隔離呢?雲解析DNS有如下一些實踐,可供中小企業使用,如圖四。
圖四
1. 華北電信一個數據中心集羣4.4.4.4因異常緣由出現大面積故障,網站服務中斷,用戶訪問失敗;
2. 網站監控在2分鐘內發現4.4.4.4集羣故障,同時通知雲解析DNS系統暫停華北電信:4.4.4.4的IP地址解析;
3. 雲解析DNS暫停故障IP解析後,只向華北電信DNS查詢返回IP地址:3.3.3.3,同時雲解析DNS解析日誌會記錄下故障時間、IP地址、暫停操做信息,並經過短信和郵件通知您的運維工程師。
4. 最終實現將用戶的訪問流量所有轉移至華北電信數據中心:3.3.3.3。
Ø 故障恢復
當網站恢復服務後,如何便捷的遷移會流量呢?如圖五。
圖五
1. 在華北電信用戶的訪問流量所有遷移至3.3.3.3後,4.4.4.4至關於離線狀態,你能夠組織相關技術同窗對故障集羣進行修復。
2. 修復完成、測試經過後,監控系統能自動檢測到華北電信數據中心4.4.4.4的網站服務恢復正常,並通知雲解析DNS恢復華北電信4.4.4.4 的IP地址解析,
3. 雲解析DNS收到華北電信的DNS查詢時,輪詢響應IP地址3.3.3.3和4.4.4.4。通過一段時間後,一半華北電信DNS獲得的結果是3.3.3.3,另外一半華北電信DNS獲得的結果是4.4.4.4。
4. 最終用戶的訪問流量會平滑的過分到原始配置各50%的比例,確保訪問流量在恢復時平滑、用戶無感知。
Ø 異地容災
對於大型互聯網企業,必需要考慮的一點是在災難性狀況發生時,如何保證用戶訪問正常,如圖六。
圖六
1. 因爲某些不可抗拒的緣由,華北電信的數據中心兩個接入IP地址:3.3.3.三、4.4.4.4所有出現故障,並沒有法及時恢復;
2. 網站監控及時發現故障,並通知雲解析DNS暫停全部華北電信線路下IP解析;
3. 雲解析DNS暫停解析後,會啓用線路間負載均衡策略,向華北電信用戶的DNS查詢返回阿里雲BGP Region地址:1.1.1.一、2.2.2.2;
4. 最終實現將總體華北電信用戶的訪問流量調度至默認線路阿里雲BGP Region:1.1.1.一、2.2.2.2,保障在極端狀況下,依然可以向華北電信用戶提供正常的服務,如圖四所示。
雲解析DNS是一種高可用性、高可擴展的權威DNS服務和DNS管理服務。提供了多種全球負載均衡策略,幫助中小企業快速、準確的將用戶請求路由至您的數據中心,同時具有高可用容災切換能力,實如今一些數據中心故障的狀況下,仍然能保證中小企業的網站服務可訪問。
將來雲解析DNS還會將會與更多的阿里雲產品相結合,例如SLB、ECS、CDN、雲盾等。造成立體化的高可用網站解決方案,從訪問入口到後端服務助力中小企業實現全鏈路負載均衡。
歡迎選購全球負載均衡版:買滿1年立享85折
https://dns.aliyun.com/buy/index?spm=5176.71615.369160.20160710.QKJmwC&code=dz-gslb