Server SAN:弄潮兒雲計算時代

最初發表於《程序猿》2014年7每個月一次。安全


4月30日本。Redhat公佈1.71十億收購Ceph開發商Inktank公司,加上以前2011年10月1.36十億收購Gluster,Redhat歸入旗下。網絡

5月17日。最後一臺小型機在阿里巴巴支付寶下線,標誌着阿里已經完畢「去IOE化」。架構

隨後國內互聯網以及有技術實力的公司,掀起了一場去IOE(以IBM, Oralce, EMC爲表明)化運動,經過開源解決方式解決計算和存儲問題。併發

Nutanix和VSAN在VMware等虛擬化中大行其道,更是把分佈式存儲推到了風口浪尖,Server SAN一時間成爲了高大上的東西。爲何會出現這番場景呢?分佈式存儲說來也不是新鮮的玩意,2000年就已經有很是多產品了,諸如GPFS, Lustre, Panasas, PVFS等,但以後十年發展一直不溫不火。事實上。說究竟仍是實際應用需求的推進。當前分佈式存儲欣欣向榮的發展景象主要源於數字宇宙的爆炸式增加。分佈式

 

分佈式存儲的發展演變性能

回想發展簡史。大體可以把分佈式存儲分爲四個發展階段。大數據



第一階段是1980s的網絡文件系統。這一時期歷史背景是以太網技術蓬勃發展,主要研究重點是實現網絡環境下的文件共享,解決client與文件server的交互問題。優化

這一階段的主要成果包含CMU/IBM合做研製的AFS文件系統和SUN公司推出的NFS文件系統。題外話。SUN公司是一家偉大的公司,如Solaris, Java, ZFS, DTrace,每一個產品在技術上都是所向披靡,但惋惜的是在商業模式和市場方面作得很差,最後淪落到被收購的結局。雲計算



第二階段是1990s的共享SAN文件系統。「天下大事,合久必分」。這一時期存儲系統開始獨立於計算機系統高速發展。存儲區域網絡SAN興起。研究重點轉變爲解決存儲系統的可擴展性和麪向SAN的共享文件系統。server

在這一階段重量級的產品是IBM研製的GPFS,以及由Redhat支持的開源項目GFS(Global File System,不是Google的GFS哦!)。這裏重點提一下,GPFS可謂是文件系統的常青樹,而且能夠保持與時俱進,不只在HPC中佔領重要地位,還能夠經過SoNAS/GSS在雲計算領域保持競爭力。

第三階段是2000s的面向對象並行文件系統。計算機技術不斷髮展,尤爲是快速網絡技術的發展。這對存儲系統擴展性提出了更高的需求。急需突破容量和性能方面的瓶頸。對應的,研究重點主要集中在對象存儲技術,怎樣進行高效的元數據管理和提升數據訪問的併發性。這一階段可謂是百家爭鳴。尤爲是開源系統異常繁榮。包含PVFS, Panasas, Lustre, Ceph,GFS(這裏纔是Google File System)等。簡要說一下對象存儲(Object-basedStorage),這是一種新的網絡存儲架構,綜合了NAS和SAN的長處。同一時候具備SAN的快速直接訪問和NAS的分佈式數據共享等優點,提供了具備高性能、高可靠性、跨平臺以及安全的數據共享的存儲體系結構。

第四階段是2010s的雲文件系統。雲計算和大數據從噱頭而起,現在已經慢慢開始真正落地。在這種背景下,數據呈現爆炸式增加趨勢。

依據研究顯示,2020年數字宇宙將達到40 ZB,比2009年的0.8 ZB猛增50倍,這當中80%以上爲非結構化數據。

雲存儲要求彈性擴展、高可用、高性能、多租戶和QoS保證,大數據則有4V(Volume、Velocity、Variety、Value)特徵,這對數據存儲和管理提出新的挑戰。

在這一階段,研究重點是EB級大規模存儲系統,數據高可用性方法(如複製、HA、糾錯碼)。高效智能存儲技術(如消重、壓縮、分層)。以及新型的計算存儲融合系統和應用感知(Application-aware,比方虛擬化)存儲。

眼下很是多分佈式文件系統都在往的雲的方向發展。諸如GPFS、ISILON、OceanStor 9000、GlusterFS、Ceph等。但離真正的雲文件系統都還有很是大的差距。

 

ServerSAN-雲計算時代的弄潮兒

「天下大事,合久必分。分久必合」。這是一種輪迴,更是螺旋式的演進。

存儲和計算分離後,IOE基本壟斷了IT企業應用市場。然而到了雲計算時代,IOE卻適應不了雲服務的彈性橫向擴展。要麼沒法知足應用需求,要麼構建和維護成本太高。去IOE運動事實上是被動地改變,這從阿里技術的發展歷程也可以看出。固然上萬名的技術團隊並不是誰都可以負擔起的。

因而,標準X86server+存儲軟件這樣的融合系統出現了,計算和存儲又又一次統一。美其名曰軟件定義存儲,Wikibon還給出了一個Server SAN的定義。簡單地說,Server SAN是有多個獨立的server帶的存儲組成的一個存儲資源池,有着良好的性價比和擴展性。依照這個定義,Nutaix, VSAN, ScaleIO, Nexenta, Ceph, Gluster等這些都屬於Server SAN。Server SAN存儲眼下主要在互聯網公司應用。如Amazon, Facebook, Google, Alibaba, Baidu, Tencent等互聯網公司研發使用的Server SAN,即Hyperscale Server SAN,這佔領了Server SAN存儲的絕大部分份額。但Server SAN已經逐漸進入了企業的數據中心。

Nutanix眼下是風頭正勁,它在應用層面對計算和存儲進行超融合,主要針對虛擬化應用。甚至連自身的控制器都是VM。VSAN更是大潮當下,剛剛公佈第一個版本號。就有很是多用戶迫不急待地測試和上線,用戶比VMWare表現更積極。

依據Wikibon的調查結果。SERVER SAN 5年後將超過傳統企業存儲,成爲市場的主流;10年後傳統存儲僅僅有10%的份額,大限將至。

儘管這個預測有點太過樂觀,但大趨勢基本是對的,ServerSAN已經成爲雲計算時代的新寵兒。

那麼,爲何 Server SAN會如此受到市場的熱捧呢?



究其起因,這歸結於Server SAN生得逢時。執行於標準X86server或虛擬機之上的軟件定義存儲,這個概念已經深得人心。X86server架構的可靠性和性能已經獲得充分的驗證,Server SAN可以利用server的大量Core。

存儲軟件和服務獨立於硬件。性價比高而且升級方便,可以提升競爭力。減小成本。傳統存儲網絡主要基於FC,傳輸帶寬和延遲遠遠優於千兆以太網,隨着10Gb/40Gb以太網和Infiniband RDMA網絡技術的引入,這卻成爲了系統性能瓶頸。而採用ServerSAN形態,計算和存儲網絡統一,就沒這個問題。最爲重要的一個因素是閃存SSD技術,高IO性能、極低延時和高帶寬是閃存的顯著特色。一塊小小的閃存卡IOPS可以達到80萬之多,帶寬達到3GB/s。而延時僅爲15微秒,全然可以和高端存儲相媲美。

閃存這樣的革新性的存儲技術使得Server SAN可以具備超高性能。正是由於X86server、快速網絡、閃存和軟件定義存儲等技術的發展和普遍應用,造就了ServerSAN的生態環境。使其在恰當的時候成爲了雲計算時代的弄潮兒。

 

分佈式存儲的發展展望

存儲技術發展突飛猛進,歷來都不缺乏新的概念和名詞,但鉛華褪去,真正留下來的纔是精髓。五年後或十年後,分佈式存儲究竟會是一個什麼樣子?這裏最好仍是大膽展望一下。

(1) 超高Scale-Out擴展能力:單一EB級存儲系統,支持萬級集羣規模。可全球範圍內全局部署;

(2) CompuStor超融合:相似Nutanix架構。計算、存儲,甚至應用高度融合;

(3) 閃存技術應用:從主存、Cache到Tier分層,閃存無處不在;

(4) 快速網絡互連:四/十萬兆以太網和Infiniband網絡獲得普及;

(5) 應用感知:I/O更加智能,性能和效率動態自適應和優化;

(6) 糾錯碼技術:基於糾錯碼提供可用性,複製技術做爲輔助;

(7) Online消重/壓縮:成爲系統標準配置。提升存儲效率。

(8) 統一存儲:存儲池,同時支持對象、塊和文件存儲。
相關文章
相關標籤/搜索