企業數據中心建設涉及建築施工、強電、弱電、暖通製冷、網絡、消防、監控、機櫃微環境和裝飾裝修等多個工序,幾十個關鍵環節,上千種產品和型號,這些基礎設施還要與上層服務器、存儲和網絡等IT系統進行有機的配合,其複雜性已經遠遠超出了通常企業IT技術人員的能力範圍,沒有高水平的技術人員以及豐富的實踐經驗是沒有辦法應對數據中心高可靠性運營須要的。 安全
現在企業的信息系統已經更多的集中到以數據中心爲核心的系統平臺。與此同時,全球化令企業業務規模快速發展,也使得系統平臺更加龐大,所須要處理的數據規模呈現爆炸性增加的需求,企業業務對系統平臺的依賴性與日俱增,這就對以數據中心爲核心的系統平臺的可靠性提出了很是高的要求,一旦數據中心有任何閃失,隨之而來的將是收入損失、停產、生產力下降、處罰/訴訟、客戶丟失等有形損失,以及會產生負面效應、客戶不滿、企業信譽下降等無形損失,可謂是牽一髮動全身,確保企業業務連續性已是當今企業最重要的課題。服務器
企業數據中心建設涉及建築施工、強電、弱電、暖通製冷、網絡、消防、監控、機櫃微環境和裝飾裝修等多個工序,幾十個關鍵環節,上千種產品和型號,這些基礎設施還要與上層服務器、存儲和網絡等IT系統進行有機的配合,其複雜性已經遠遠超出了通常企業IT技術人員的能力範圍,沒有高水平的技術人員以及豐富的實踐經驗是沒有辦法應對數據中心高可靠性運營須要的。與此同時,居高不下的運維成本,也使得企業數據中心很難依靠自身的力量管理髮展。在這種狀況下,愈來愈多的企業開始把目光投向了那些具備高可用等級的公共數據中心服務,爲了與現有IDC數據中心業務進行區分,人們將具備高可用等級的公共數據中心服務稱爲EDC。網絡
與IDC業務相比,EDC具備更高級別的數據中心可靠性,具備更加完善的基礎設施平臺,以高效可靠供電爲例,EDC會提供雙路市電,外加柴油發電機的供電保護,其中每一路市電均配有N或者N+1的UPS供電保護,如此一來,任何一路市電供電中斷,都不會影響IT系統的供電。即便兩路市電同時中斷,也還有柴油發電機的供電保護,按照設計要求,柴油發電機一般有不低於72小時的油料儲備,同時這些數據中心還與其附件的加油站簽署有油料保障協議,幾乎能夠作到萬無一失。運維
但真的是這樣嗎?咱們不幸地看到,不斷有高等級數據中心宕機事件見諸報端,如2011年12月13日,亞馬遜旗下英國、法國、德國和西班牙數據中心宕機超過一個半小時,在過去的幾年時間內,全球最大的支付平臺PayPal、Google gmail系統、微軟數據中心、iWeb CL數據中心、Chase.com網上銀行、knocked Intuit網站數據中心均發生過嚴重的宕機事件,有些宕機時間甚至超過了24小時。國內的高等級數據中心也不可以倖免,有些具備2(N+1)外加柴油發電機的可靠供電保障的數據中心,也一度發生了電力中斷的事件。ide
談到數據中心高可用性,萬國數據副總裁梁豔表示:「數據中心高可靠性並不只僅是高等級數據中心設計以及產品設備的簡單堆砌,高投入並不必定帶來高可靠。數據中心的高可用性須要一整套管理的方法論和指標體系,其中,不少須要進行量化。爲此,萬國數據創造性地提出了適用性的概念,強調可用性的建設應該圍繞業務發展的需求,經過整合ISO20000、ISO2700一、BS25999標準在可用性方面的要求,結合自身多年的實踐,創造了業界首套IT高可用管理體系方法論,從評估、規劃、實施、運行與監控等5個層面實現。同時,經過引入製造業 SOP的管理方式,對數據中心的標準做業進行管理,從而爲用戶提供專業化的指導和安全高可用的保障。」網站
仍以高可靠供電爲例,2(N+1)外加柴油發電機的保護只是基礎,還須要高可用的管理體系,依靠運行管理,及時發現系統在運行中的隱患。目前不少數據中心還停留在過後告警的階段,即發生了故障或錯誤提供告警,根本不具有主動式高可用實時監控服務的能力。若是監管水平到位,將能夠有效提升數據中心的可用性,避免數據中心中斷給用戶帶來的損失。ui
對於用戶而言,也須要挑選哪些真正具備高可用等級保障的公共數據中心服務,有些數據中心對外宣傳具備高效可靠供電的保障,設計了2(N+1)外加柴油發電機的 安全保障,但實際上,僅是在某一個特定區域按照2(N+1)設計,用做樣板工程和對外宣傳,這就須要用戶在柴油發電機配置臺數和總功率方面認真加以覈算,挑選哪些真正具備高水平的保障的數據中心。spa
機房配電、UPS、蓄電池、發電機監控的重要性設計
數據機房的正常運行的保障就是供電可以獲得保障,而供電設備包括了配電(220v、380v或者高壓電)、UPS、蓄電池、發電機等,而市電是機房主要供電方式,當市電中止以後,機房可以自動切換到UPS或者是發電機,由這些設備繼續爲機房供電。事件
在機房監控系統裏面,爲機房供電的設備咱們都稱之爲動力設備。動力設備是機房監控系統裏面很是重要的一部分,一般會對市電、UPS、發電機、蓄電池進行如下參數監控:
一、 市電 常規的數據機房會採用380v的電壓供電,普通的監控機房會採用220v供電。機房監控系統主要對三相電壓、三相電流、有功功率、無功功率、缺相的等數據進行採集分析。當市電停斷後,系統經過短信、語音、聲光等方式對機房維護人員進行告警。
二、 UPS UPS又稱之爲後備電源,當市電停電後,UPS自動啓動對機房或者是一些不可斷電區域進行繼續供電。然而,UPS供電只能是應急處理供電,沒法長時間提供電能;供電時間根據蓄電池的容量來定。UPS監控常規監控數據通常包括:輸入電壓的監測、輸出電壓的監測、旁路電壓監測、電池電流、電池溫度、電池剩餘時間等。(UPS只能進行監測通常不進行控制;監控的數據根據廠家提供的協議)
三、 發電機 發電機相對於UPS,能對機房提供的電能時間更長。發電機監控的數據通常爲油溫、油位、轉速、油機的輸出電壓、市電功率、市電供電狀態等。
四、 蓄電池 蓄電池的監控可分爲電池組監控和單節電池監控。參數通常包括:電池總電壓、電池電流、電池溫度等。
五、 文章選自:機房監控系統http://jcd0755.cn.topoyo.com