做者:崔昊 - DOIT傳媒執行總編,七年IT媒體從業經驗,關注服務器、存儲和信息化領域 php
數據普遍存在於企業的IT系統中,是企業發展的核心,一切的IT系統發展都有賴於數據,並服務於面向企業業務的數據管理需求。隨着IT行業的發展以及企業對數據管理要求的不斷進步,數據管理的「智能」趨勢已經銳不可當,智能的數據管理正在成爲全部企業所追求的共同發展目標。web
本文是《數據管理的智能趨勢》系列文章的第四篇,在本篇文章中,您將瞭解到,保護與成本的兩面性體如今何處,如何利用更輕鬆的方法巧妙地化解數據保護與支出成本之間不斷增加的矛盾。此外,咱們還將在本文中,爲您講述多代數據保護、低成本的長期保護及創新的對象保護等兼具數據保護需求與成本效益的方法,如何構建智能數據管理中相當重要的數據保障。安全
而在下一篇文章中,咱們將重點介紹「面向將來的數據管理」,幫助您瞭解,將來的數據將是不斷流動的,而技術也將在數據的流動中不斷髮展。同時,下一代數據中心技術,包括存儲、服務器及網絡技術,將帶來怎樣的對於數據管理的變革,智能數據管理又爲什麼成爲將來數據管理的堅實基礎和可靠保障。服務器
數據保護是數據管理中不得不面對的一個問題,良好的保護——讓數據不存在丟失、損壞或是泄露,保證數據的「完整的存在」——是數據管理的核心議題,同時,也是數據管理的管理行爲中,最爲基本的工做。沒有數據,何談管理?網絡
當今的公司、企業和組織,甚至是每一個人,都意識到了數據丟失的威脅和後果,到目前爲止,大部分公司都採起了某種形式的數據保護。可是,那些擔憂丟失重要信息資料轉而涌入數據保護行列的公司可能太過急於求成地將將各類軟件、系統或是解決方案東拼西湊起來,如今證實這樣的舉措付出的代價是高昂的。架構
圖釋:做爲數據保護的重要手段,備份恢復和災備現在都是CIO們關心的話題,可是本地系統的數據保護若是還未理順,何談災備?app
圖釋:從TheInfoPro存儲研究的報告中咱們可以瞭解到,大部分CIO都明白,好的數據保護是企業的數據存儲關鍵點,但這個調查結果也顯示出,用戶對於數據保護的要求是複雜且多種多樣的,傳統的、線性的保護已經不可以知足用戶的需求,用戶須要智能數據管理。ide
在急於獲取數據保護的潮流中,不少企業瘋狂地未來自不一樣廠商的技術拼湊在一塊兒,然而卻忽視了軟件集成和政策等問題。因爲擔憂沒法應對數據丟失問題,數據保護工做被倉促上馬,從而致使其缺少規劃和技術實施的處理過程。如今,他們不得不留下來收拾殘局。工具
更糟糕的是,那些還沒有實施數據保護技術的公司看到了其它組織在數據保護難度和成本方面碰釘子,並打算開始評估這一風險等式。最終,常見的狀況是,他們願意承擔缺少數據保護的風險,而且也願意面對潛在的數據反串所產生的後果和成本開銷,而不肯意去執行那些他們以爲費用昂貴且複雜的數據保護解決方案。性能
但事實上,數據保護工做所須要實現的效益和所須要付出的成本,是可控並能夠接受的,同時,良好的軟硬件結合的數據保護解決方案,可以很好的保護數據使之達到知足服務水平管理協議(SLA)的要求,爲進行智能數據管理提供堅實的數據基礎。
同時,數據保護的需求正在多樣化,除了保證數據不損壞、丟失和泄露以外,下降長期保護的成本、經過數據保護保證在線系統性能、爲在線系統的運營數據提供有效保護、法規聽從都是「必須同時」而非「隨時可選」,企業用戶須要更智能的數據保護。
數據保護與成本的兩面性:更好的保護是否意味着更貴的成本?
大多數的企業、組織、公司認爲,更好的數據保護意味着更貴的成本,只有花更多的錢,纔可以得到更好的數據保護,事實倒是,得到最高級別的數據保護並不是必定須要不菲的花費。
良好的數據保護來自於三個方面:一是高度的認知程度與警戒意識;二是針對重要程度不一樣的數據採用不一樣的數據保護方法;三、創建良好的數據保護策略與數據保護的管理方法。只要作到這三點的基本要求,得到高水準的數據保護同時兼顧較低的成本,並不是不可能。
時至今日,咱們仍然遺憾的看到,許多企業表示對於哪些信息須要保護感到毫無頭緒,並且據AIIM-The ECM Association的調查顯示1,大部分企業都不知道若是不保護好本身的信息可能會帶來什麼樣的潛在成本。
AIIM公司市場信息副總裁Carl Frappaolo認爲:「人們幾乎都不肯意在內容保密上花太多的時間和金錢,由於人們老是天真地認爲若是咱們歷來都不會遇到那種事情,咱們就沒必要老是擔憂它會發生。」但事實是,這些被調查人羣中的許多人隨後都發現,企業中的信息丟失、損壞或是乾脆被刪除了。對數據保護的重視程度,是數據保護的基礎之一。
具備較高成本效益的數據保護的基礎是考慮數據的重要程度和特性,以早期的系統保護方式:高可用性雙機熱備(高可用集羣,HA)爲例,HA須要兩套徹底相同的硬件設備並得到相同的軟件受權,兩套系統互爲備份,同一個I/O發往兩個設備但只返回一個結果——由於其中一臺並不是在線模式而是離線模式,準備在另一臺系統宕機的時候隨時接管業務——但會有CIO在全部的業務中都採用HA嗎?答案顯然是否認的,道理很簡單:HA讓系統成本翻了一番,若是咱們以一樣的模式思考數據保護,這其中的問題就是,全部的數據都須要花費不菲得到最頂尖的保護麼?
數據的重要程度和特性的變化,表如今成本的投入上,越是重要的數據投入越大,通常的數據,尤爲是長期不訪問的數據,磁帶等更低成本的解決方案會更加行之有效。最重要的是,節省了大量成本。
之因此說智能數據管理是將來的趨勢,正是由於其在保護數據時,首先考慮到了數據的重要程度。
智能數據管理在保護數據時根據不一樣的應用級別保護數據,以不一樣的成本去保護數據,並根據其重要程度,在相對應的成本下,選擇不一樣的數據保護策略和方式,這是一個避免「撿了芝麻丟了西瓜」的重要守則,讓有限的成本投入到最須要高等級保護同時也是最重要的數據上去。這是智能數據管理對數據保護的首要要素:按照重要程度分類數據,並以重要程度爲標準投入對應的數據保護成本。
在智能數據管理的理念下,數據保護採用了根據業務系統所搭載的業務應用級別不一樣,如業務量、重要性、相應級別、恢復宕機等方面要求,投入不一樣成本進行保護的模式——不是全部的業務應用,都具備相同的RTO(恢復時間目標)和RPO(恢復時間點目標)指標,以電信行業爲例,核心的計費BOSS系統和並不經常使用的通知下發平臺的RTO和RPO就必然不一樣。
此外,數據又擁有結構化/非結構化、長期保存/短時間保留等不一樣的特性,數據保護也必需要考慮到這一個方面。
在智能數據管理體系中,不一樣類型的數據、不一樣的保護週期都有適合的數據保護架構,如長期的、對象化的、須要具備法規聽從的一次寫入不得更改功能的數據,就不適合常規的磁盤備份、虛擬磁帶庫或是磁帶庫,而更適合相似戴爾DX存儲這樣的對象存儲系統。這樣的數據保護機制,其根基是對數據特性、數據生命週期(除了法規監管的需求外,是否某些數據其實能夠被刪除?如臨時文件)問題的深入認識。這也是智能數據管理的數據保護機制更加優異的緣由:數據依照其特性而被量身定作的保護。
固然,創建良好的數據保護策略與數據保護的管理方法是最後的「上層建築」,一方面,在虛擬化時代來臨的今天,虛擬化時代的數據保護和物理時代的數據保護有顯著的不一樣;另外一方面,不一樣的備份、恢復、歸檔等數據保護策略,如增量備份、全備份、差別備份、磁帶歸檔、磁盤備份等不一樣的方式方法,將顯著的影響成本和數據保護的能力。
無縫擴展對數據保護的意義
在以前的三篇文章中,咱們屢次談到了戴爾Compellent和EqualLogic存儲系統,並介紹了其無縫擴展技術,解釋了這項技術在企業的數據管理、存儲系統擴展及虛擬化環境變革方面所帶來的受益,在數據保護的話題上,咱們一樣可以看到這項技術所煥發的光彩。
無縫擴展技術的實現,在數據保護層面具備極大的意義,在過去,企業每次購進新的存儲系統,都要作兩件事情:一、進行數據及應用遷移;二、更換新的數據管理應用程序。
這兩項工做所蘊藏的風險很是之大,數據遷移可否成功,新存儲系統可否無縫的、平滑的把應用從舊有的系統接管過去,存在着極大的不肯定性;新的數據管理應用程序,可否很好的適應現有的應用系統及數據保護策略?
圖釋:Compellent採用按需擴展的單一平臺,保證數據不會由於系統擴展和升級,遇到保護方面的問題。
沒法支持無縫擴展的存儲系統,將逼迫企業的應用人員從新進行培訓所花費時間和金錢即使忽略不計,更換新的管理方式後所形成的人員生疏,從而致使人工錯誤大幅度上升,這幾乎沒法避免。
無縫擴展在數據保護層面具備極大的意義,一、它解決了企業須要對存儲系統、數據管理方式進行更迭、遷移的現狀,不只省卻了大量的時間,而且杜絕了數據和管理策略在不一樣系統中不斷變換的風險;二、無縫擴展保證了多代系統都可以良好的接管數據和信息管理,前代的數據格式、管理方式以及數據自己可以很好的被繼承下來——就像是咱們以前舉過的例子,數據就像是貨幣同樣,長久可用,「銀行(數據系統)」所作的升級不對其形成任何影響。
圖釋:分層技術不只能減小數據存儲的成本,將不一樣重要性的數據存放在不一樣的介質上,大幅度提高系統性能的同時,減小了在線存儲系統(Tier0、Tier1層)的負擔,減小系統中可能發生的熱區(Hot Area)自己對系統也是一種保護。
此外,咱們在以前的文件中介紹的自動分層技術,一樣在數據保護領域有所功效。其呼應了上面所提到的「針對重要程度不一樣的數據採用不一樣的數據保護方法」,在SATA、SAS、FC、SSD等多種磁盤混合的存儲系統,實現自動的分層存儲,將生產數據放置在高速的SSD或15k rpm的SAS、FC磁盤上,而將較少訪問須要I/O性能較低的數據放在更爲低廉的大容量SATA或NL-SAS上,自己就是在生產系統上進行了更具成本效益的數據保護。
此外,在磁盤陣列、磁盤備份系統、虛擬磁帶庫系統(VTL)、磁帶存儲系統及對象存儲等多種架構的系統中實現分層存儲,也是經過對數據的重要程度和須要的可訪問性進行分層,實現的更具成本效益的數據保護。
低成本的長期保護與創新的對象存儲
上面咱們提到,須要經過對數據的重要程度和須要的可訪問性進行分層,實現的更具成本效益的數據保護,這意味着咱們不只須要面對一些「即時可用」的數據進行保護,也須要對一些「長期需用」的數據進行保護——長期的數據保護必然須要更低的成本。
首先,咱們就須要瞭解如何以較低的成本,長期的進行數據保護。戴爾與賽門鐵克、CommVault兩家數據管理、備份恢復與歸檔平臺供應商合做的PowerVault DL2200是一個能夠參照的樣本,咱們能夠看到,從PowerVault DL2200+賽門鐵克、CommVault的方案上,
咱們看到了兩個須要注意的詞彙,一個是重複數據刪除,一個是虛擬磁帶技術,這兩項技術對於長期的數據保護來講,具備極高的成本效益:重複數據刪除將清除掉大量冗餘、重複的數據,減小長期須要保護的數據量;虛擬磁帶技術則以磁盤系統模擬磁帶輸入輸出及磁帶格式,可以減小對現有的、每每是五年、十年或更長期的基於磁帶的數據保護架構的「破壞」,造成平滑的數據保護接入。
減小數據量、根據現有的架構調整數據保護模式,智能數據管理的理念貫穿始終,而對於更爲長期的,並須要符合法規聽從——咱們在以前的文章中提到過,智能數據管理的其中一個話題就是智能的符合法規聽從要求——的數據而言,新的對象存儲模式則提供了極高的可用性,能夠做爲長期的、對法規聽從有須要的數據保護要求的參照產品。
此外,對象存儲也是一個長期保護的好辦法,它是繼塊、文件訪問以後新的存儲底層訪問架構模式,專爲智能訪問、存儲、保護和分發固定數字內容而設計, 其具備如下特色:一、通常採用即插即用式架構,以及自我癒合和自我複製技術,可以有效地下降存儲平臺的管理成本和複雜度;二、可以打破傳統文件系統之間的屏障,一個存儲集羣可以容納無限數量、大小的文件或原始容量;三、對象存儲平臺可以讓用戶將固定的、非事務性的內容遷移到一個新的存儲層,可以使SAN或網絡附加存儲部署規模更小,佔用資源更少,從而下降管理與支持成本。
戴爾在去年推出了其自主設計研發的DX對象存儲系統,在部署的過程當中無需配置LUN,無需進行其它設置,可以真正作到即插即用。同時,戴爾DX對象存儲平臺不管是在容量上仍是數據吞吐量上,都能實現輕鬆高效的擴展。
重要的是,在擴展戴爾DX對象存儲平臺容量時,用戶無需中斷正常的系統服務,就能進行無縫的擴展,而且這種擴展對文件系統的類型,文件的數量和大小,都沒有限制,並且隨着存儲節點的增長,整個系統的吞吐量也會同步提高——若是這稱不上是智能數據管理?那麼,咱們還須要什麼樣的智能?
虛擬化爲數據保護帶來全新挑戰
事實上,不少的企業也遇到了虛擬化時代數據保護的困難,據資料顯示,Veeam調查了位於美國、英國、德國和法國的員工人數超過1000人的公司,訪問了500位首席信息官2,發現44%的首席信息官表示在一些任務關鍵型工做負荷上會避免採用虛擬化,由於他們擔憂虛擬化會影響備份和恢復。許多公司只備份三分之二的(68%)的虛擬化數據。61%使用物理手段來進行備份和恢復的企業從如今開始會針對虛擬化改變他們的數據保護方式。
此外,63%的回答者使用單一產品來同時備份他們的物理和虛擬服務器。在這種方式下,他們仍然視虛擬機爲物理服務器,於是限制了虛擬化的使用程度。所以,這些企業在虛擬化的任務關鍵型工做負荷上沒有獲得應有的最佳的保護水平。
傳統的在物理時代保護數據的方式,在虛擬化時代也被認爲是不可取的,在被問到關於在虛擬環境中使用傳統基於物理的備份工具的缺點時,超過一半的回答者(51%)指出這種方式太昂貴。除了這個,40%的回答者指出恢復速度太慢,還有40%的回答者指出缺點是須要安裝軟件代理。
隨着大多數部署了虛擬化的企業的CIO明白,對於虛擬環境的數據保護,成功的關鍵決不是對傳統備份手段加以調整就能夠知足需求,企業的管理者們開始尋找新的方法,如利用VMware所提供的VAAI、VASA等API及微軟Hyper-V的API進行數據的備份、恢復和歸檔,但最重要的是,「須要一顆虛擬化的‘心’」——正如以前一篇文章所說,Compellent和EqualLogic及戴爾的存儲系統,都已是「Virtualization Ready」的。
新觀點:在線系統處於數據保護前沿
是否只有備份恢復、歸檔、對象存儲、虛擬磁帶庫這些名詞與數據保護有關,對於處於生產系統前沿的主存儲系統而言,數據保護是否與其造成了自然的隔絕呢?數據保護是否只是針對將「數據靜態的保護起來」,而處於流動狀態的數據信息,是否就只可以依靠硬件系統的可靠性來獲得最基本的保護?
智能數據管理提出了一個新的觀點,那就是「在線系統(Tier 0、Tier 1層的主存儲系統)處於數據保護的前沿」,在線存儲系統如EqualLogic、Compellent在保護數據的可靠性、可用性和安全性上,一樣應當作足功課。
在這個觀點看來,做爲數據的發源地及數據生命週期最開始的地方,在線主存儲系統應當具備更好的保護數據的能力,作到讓數據合理、快速、完整的進入到數據保護中後期流程中。
圖釋:EqualLogic的脫機主機備份(Server Free Backup)結合戴爾PowerVault DL2200和磁帶庫,構成了具備成本效益的可以快速實施的方案,保證數據自服務器系統一經出現,直到最後歸檔的全過程的保護。
主存儲系統首先應具有更好的支持備份恢復、災難恢復的系統的能力,協助加快備份恢復和歸檔的速度,支持CDP(持續數據保護)技術的整合應用;其次,要可以經過Snapshot(快照)、Clone(克隆)、Replication(複製)等技術,提供對在線運營數據的良好保護。同時,這些操做應當是自動化、智能化的,減小人工干預的成分存在。
這一觀點的提出,不盡擴展了智能數據管理理論在數據保護範疇內的應用,同時也完善了數據生命週期的生產/在線週期內的數據保護工做的思路。
總結:數據保護與成本可以兼得
綜上所述,知足需求的數據保護與合理的支出成本是能夠兼得的,有輕鬆的方法巧妙地化解數據保護與支出成本之間不斷增加的矛盾——多代數據保護、低成本的長期保護及創新的對象保護等兼具數據保護需求與成本效益的方法——實現了這一用戶的夙願,數據保護並不是昂貴和複雜的,低成本、簡單易用、長期有效,經過合理的方法均可以獲得。
下一篇文章《數據管理的智能趨勢(5):面向將來的數據管理》將是本系列的最後一篇文章,在最後的一篇文章中,咱們最後將爲您介紹爲何智能的數據管理已經成爲將來的數據管理髮展方向之一,以及數據管理技術的演進;爲將來準備就緒且知足革新的系統升級理念的存儲系統究竟是什麼樣子?將來的數據管理又須要哪些必須的保障?敬請期待。
相關資料:
1 AIIM-The ECM Association,位於歐洲的調查分析公司
2 《Executive Brief on VMware Backup and Recovery Curtis Preston》 , Veeam Software ,2010年
全部文章:
更多精彩文章請關注: