層層考慮可用性的互聯網系統

時間 2019-11-08

標籤層層考慮用性互聯網系統简体版

原文原文鏈接

互聯網系統7*24小時不分晝夜的爲人民服務，那麼這樣長時間服務的背後究竟有哪些手段保證呢？linux

這其中包括軟硬件，及基礎設施的保障。程序員

IT人的努力

分佈式系統

軟件架構師在設計大型互聯網系統時考慮的高可用性是從分佈式系統的特色考慮的高可用。主要的思路就是在各個層面作冗餘，備份。web

訪問全部網頁的第一步，解析DNS, 全球十二個根服務器，從國家，骨幹網，各級運營商核心機房，省級機房，局站都有DNS緩存服務器，保證解析速度。固然，大型網站專門自建的DNS服務器也都是一組集羣。redis

提供服務的web應用只有一個服務器不安全，而部署一組一樣功能的服務器集羣就下降了單個服務器產生故障的風險。數據庫

IDC

一組在同一個IDC中的應用集羣在IDC級別是單點（天朝常常遇到挖光纜，遭雷劈），要將應用集羣跨機房部署，此時要求應用無狀態，能夠隨意部署。緩存

IDC的建設在國內有運營商（電信、聯通、移動）和第三方基礎設施提供商（如世紀互聯），因爲國內的現實情況，運營商提供的IDC網絡質量較好，可是不能提供多線互通；而第三方質量比較良莠不齊，有好有壞，但能提供BGP多路接入，通常出口帶寬較小。安全

最高級的T3機房的設計要求一條就是要能抗8級地震，也就是跟幾年前汶川同樣的震級。服務器

高可用軟件

Heartbeat與keeplived，此類軟件採用IP漂移技術，主要側重在作服務器的主備切換，在一些自己沒有集羣功能支持的產品上，如早期Redis上能作簡單的主備高可用，並對應用自己無感知，簡化應用開發。若是單個一組主備的redis不能知足容量需求，須要作Redis集羣，則要用一些簡單工具庫人爲對redis的讀寫進行分片（如jedis），此時集羣維護成本變高，最好組件自己有原生的集羣功能支持。微信

存儲

數據庫服務器用的硬盤使用raid10保證本地硬盤上的冗餘，再經過linux LVM卷管理作本地存儲冗餘備份，再經過存儲廠商的商業解決方案或自研技術將單IDC的數據複製到同城異地IDC的存儲系統中，保證若是源站IDC被毀（極端的地震，戰爭），在同城另外一個機房仍有可恢復的備份。網絡

固然若是有地震，那麼同城容災就不夠了，還須要異地容災，由於地震一般是區域性的，杭州地震不會對上海機房有很大影響。

光在存儲上作異地容災是不夠的，若是是冷備，平時並無用起來，也沒有合理的機制作演練切換，真到了一個IDC故障須要將應用讀取切到備庫上去的時候，沒人內心有底敢作這個決策，尤爲是金融系統，數據庫一旦出錯會對企業形成可能致命的資損故障。

能夠參考工商銀行2013年6月23日波及全國的長時間停機故障，說明我國國有銀行IT信息化技術儲備仍然薄弱，主要解決方案仍是被美國廠商綁架。

國企背景的辦事思路通常找500強諮詢公司要方案並實施，這樣負責人能夠不用擔職業前途的風險，出問題了所有推到合做方身上，並不考慮本身能爲企業提供什麼價值，典型的官場思惟，固然這是題外話了。這個問題如今運營商高層應該已經認識到了，能看到目前運營商的思路有了一些變化，開始在自營業務上作技術和人才的儲備了。