F5公司的負載均衡解決方案在銀行中起什麼做用?

  F5公司的負載均衡解決方案在銀行中起什麼做用?今天咱們就來探討一下這個問題。安全

  我是民生銀行的,我所在銀行採用負載均衡解決方案實現了同城雙活數據中心的業務部署和數據中心之間的業務快速切換,除此以外,在多個數據中心向兩個新建數據中心整合的遷移、IP地址改造和平常業務上線的測試、驗證、發佈及維護過程當中也起到了很是大的做用。服務器

  F5公司的技術和產品在金融行業有着普遍深刻的應用, F5總體應用交付解決方案中包括多中心多活並行的應用交付解決方案,與數據中心多活實踐的需求相吻合。F5的多中心多活並行應用交付解決方案在實現多數據中心應用多活部署的同時還包括應用加速、應用安全、集中管理等功能,可立體地知足業務發展需求。在部署F5多數據中心並行應用交付解決方案後,在後續業務擴容和功能追加時可平滑地擴展:當須要增長F5設備的功能時只需增長license而無需進行硬件的調整;按需插卡式設備只需在原來設備中添加板卡便可擴充設備的性能,而整個架構和設備的配置均無需發生任何變化。網絡

  F5提供GSLB+LB(即GTM+LTM),RHI,N+M cluster等多種方式的多中心多活並行解決方案,可根據實際的基礎架構和應用需求選擇一種或多種方案實現多數據中心的應用多活。根據我所在銀行的實際需求,咱們選擇了GSLB+LB的方案來實現對互聯網業務的雙中心流量的選擇智能引導,N+M Cluster的方案來實現對數據中心內部業務的雙中心狀態探測和切換,具體包括以下的考慮。架構

  主動的健康檢查:這包括對網絡鏈路狀態監測、對服務器的應用狀態深度健康檢查,經過F5多樣化的健康檢查方式,能夠在鏈路層面、服務器硬件層面、應用軟件層對雙中心的可用狀況作出準確的判斷,從而肯定雙中心是否須要切換、以及是總體切換仍是部分資源切換。負載均衡

  靈活的負載分擔策略:建設多活中心的重要特徵是「多活」,以充分利用各中心的資源,提高資源利用率。F5能夠根據業務須要,基於用戶來源地域、延時狀況、使用的運營商、負載權重等不一樣的因素來制定負載分擔策略,實如今多個數據中心之間進行業務的分配。運維

  基於業務需求的NAT:在多活數據中心的環境中,常常可能的切換對IP地址提出了動態漂移的要求,F5能夠提供一對1、一對多、多對多的地址轉換,靈活適應業務切換的須要。性能

  自定義的iRules:根據多中心的要求,經過F5的iRules腳本的定製編寫,可實現不一樣業務定製化的流量牽引,例如對雙數據中心的突發流量應急調度牽引,出向流量的優化控制,根據業務場景動態選擇不一樣的SNAT/SSL profile等;測試

  可預設定的接管順序:基於F5的N+M cluster機制,經過F5集羣節點之間的切換和接管,牽引業務流在數據中心之間從新分佈,更爲重要的是,集羣節點之間的切換能夠預先定義接管順序,使多活中心的運維是可管理和可預期的,並符合數據中心的分佈使得延時和影響最小。這種能夠預約義接管順序已在業界獲得了實踐驗證。優化

  儘可能減小現有基礎架構變更:基礎架構的調整影響很是大,採用局部優化、按部就班改造的方式控制風險,對業務的穩定運行很是重要。同時,在實施的過程當中,咱們重點考慮了雙活數據中心高可用方案的可管理性和可運維性,使之不只僅只是一個好的紙面方案,更能是一個好的實踐工程,能真正地在銀行的生產環境中可靠運行。這些實施過程當中的考慮要點包括:設計

  本地同機房切換優先:業務在同機房的切換會影響小些,而若是是同城跨機房的切換,則相對影響要大一些。在考慮基於F5的集羣N+M的切換實現時,咱們在兩個同城機房各部署了兩臺F5 LTM設備,一共四臺組成N+M集羣,在切換的時候,某一個業務能夠從其中一臺LTM向其餘三臺中的一臺進行流量牽引。從業務平滑的角度考慮,咱們須要優先保證同機房的優先切換,所以,針對每個業務,在設定N+M集羣的切換順序時,都應該按照先同機房,後同城的順序來設定集羣接管順序。

  管理調度:考慮業務分佈在同城雙中心是否按1:1部署。在雙活數據中心的設計中,因爲每一個數據中心都是「活」的對外承擔業務的,自己容量的設計並不須要1:1的部署,可是考慮到若是一個數據中心徹底失效的極端狀況下(雙中心割裂是目前的主要風險),另外一個數據中心的處理容量應可以承擔完整的業務量。同時,基於「雙活」的情景,管理調度能力應能夠實現對突發流量的應急處理,在多中心之間自動削峯調度。

  切換的協同聯動:在建設雙中心時,每每因爲實際客觀條件的限制,會存在某些環節不能實現徹底的冗餘備份,例如最多見的是與不一樣運營商的網絡出口,例如電信、聯通的線路配備了雙出口,可是移動、廣電等線路仍是單出口。咱們須要將雙中心的各個環節進行梳理,針對實際建設中的單點環節,專門考慮協同切換,將受影響的因素進行捆綁協同。

  運維自動化考慮:包括和系統、應用的配合互動,包括監控和響應。因爲雙活數據中心涉及到的環節和流程特別多,爲了更好地運維雙活中心,可採用大量的自動化腳本,同時充分利用F5的iControl接口,可實現一鍵DC切換,一鍵DB切換,自動配置採集及上傳,F5配置合規性檢驗,單一數據中心配置關聯性提取,多數據中心配置一致性對比,F5應用統一視圖生成等,並和統一運維管理平臺進行集成,提高多中心環境下的運維水平和運維能力。筆者所在銀行採用這些功能設計實現了同城雙活數據中心的業務部署和數據中心之間的業務快速切換,除此以外,在多個數據中心向兩個新建數據中心整合的遷移、IP地址改造和平常業務上線的測試、驗證、發佈及維護過程當中也起到了很是大的做用。

  使用跨中心雙活集羣,在新數據中心部署業務後,能夠無縫的將一個業務從一箇中心變爲兩個中心雙活。同時跨中心集羣的使用,將A/A, A/S模式的雙機結構擴展爲N+M模式,以下圖所示:
  

  經過SNAT功能,將服務地址與真實服務器徹底解耦。F5設備所在的位置與服務器位置徹底無關,這樣就給予應用在數據中心之間遷移或搬遷最大的靈活度,當一個業務系統要從A中心的搬遷到B中心時,徹底不須要進行業務中斷。IP地址的改造時,能夠留給業務系統更多的彈性時間。在多中心整合過程當中構建業務多活場景,簡化業務遷移過程,最終整合爲同城雙中心。

  經過負載均衡設備進行差別化業務驗證。多中心運行的業務,在進行業務測試或變動過程當中,經過負載均衡技術能夠將部分或特定的業務訪問(好比指定客戶端IP或HTTP URI等)發送到指定服務器進行業務驗證。

  同城多中心均能承擔業務流量並週期性進行故障演練,演練涉及各個節點的故障模擬場景,多中心的以不一樣業務負載比例在線服務,實時驗證「備用」環境的可用性,杜絕真正發生一個數據中心故障時切換不成功的問題。

  設備的多角色分權管理。負載均衡設備涉及與應用相關的處理,橫跨多個部門,所以設備的分權管理尤其重要,既要有相關變動權限,又要避免相互影響。所以在數據中心設備管理中,負載均衡設備管理員權限由網絡部門統一管理,同時可爲不一樣應用部門分配不一樣的只針對其職責內的變動和配置權限,將具體應用層面的平常操做從網絡部門設備運維中剝離,既簡化運維管理工做,又能明確權責劃分。

  數據中心實現多活後,效益是多方面的,不只提升了業務的持續性,同時還在資產使用效率等方面提升顯著:

  快速感知和故障快速恢復:當一個數據中心業務發生故障時,健康檢查和探測對故障的感知降到分鐘級甚至秒級,在大部分故障場景下,可實現分鐘級甚至秒級的切換。

  按需切換:當服務器或業務須要切換時,並不須要把所有應用都切換至備份中心。

  資產盤活:在傳統主備數據中心的模型中,備份數據中心徹底不進行業務處理而僅僅作爲熱備或冷備,這對資源的使用是極大的浪費。多活數據中心的引入則盤活了備用的資產,提升了資產使用率。

  經過F5這些方案和功能設計,我所在銀行目前已完成20餘套業務系統的雙中心部署及多套系統的同城多中心整合遷移,並在實際使用、維護過程當中獲得驗證。

  多活數據中心做爲數據中心發展的一個階段,其必然不是一成不變的,隨着業務需求的不斷髮展,數據中心還將朝更加先進的方向前進,而負載均衡解決方案在目前及可預見的至關一段時間內仍有很大的使用空間,所以,利用負載均衡解決方案來配合多中心建設是一項很是具備實際意義的實踐。

相關文章
相關標籤/搜索