RAID2.0核心思想:數據保護與物理資源管理域分離

記得在2013年底的時候,開始將存儲虛擬化爲主導的數據保護技術概括爲RAID2.0。從市場的角度來看,這個一個很是好的概念,一方面能夠延續傳統RAID的思想,你們能夠很容易明白這是一種數據保護技術;另外一方面又表述了這是一種傳統RAID的技術延伸,並且具備更新換代的意思。在技術發展的過程當中,HP稱這種技術爲virtual RAIDNetApp稱之爲DDPDynamic Disk Pool)。本質上的思想是相同的,都是經過底層虛擬化的方式使得RAID構建的靈活性大爲增長,而且在數據恢復的時候可以作到全員參與,提升數據恢復的性能。架構

 

經過RAID2.0的技術方式的確可使得數據重構的性能隨着磁盤數量的增長而線性提高。傳統RAID因爲結構僵化,數據重構的性能侷限在單盤性能,在一個磁盤組中,不管磁盤數量多少,數據重構的性能最高爲單盤吞吐帶寬。在採用RAID2.0技術以後,數據重構再也不是單盤參與,而會涉及到存儲池中的全部磁盤,所以,磁盤數量越多,數據重構性能越高,數據恢復的時間窗口越短,從而數據可靠性越高。下圖是一套RAID2.0系統在2013年的實測結果,從該結果能夠看出,RAID2.0數據重構性能和RAID相比存在天壤之別。可是在JBOD數量爲2時,能夠發現RAID2.0性能還比傳統RAID低了。這主要是由於磁盤自己抖動形成的結果。採用這種RAID2.0以後,數據在磁盤上存儲的IO Pattern發生了變化,這也是RAID2.0技術不能在小規模磁盤存儲中大量使用的一個重要緣由。分佈式


wKiom1g5rHywIjiyAAB1a5-TerE871.jpg


在海量存儲系統中RAID2.0已經開始大規模部署,在閃存存儲系統中一樣能夠採用這種數據保護技術。而且對於閃存存儲,RAID2.0具備自然優點,其最主要緣由在於SSD不存在隨機寫性能急劇降低的問題。和磁盤相比,NVMe SSD的故障模型存在較大差別,若是採用傳統RAID架構實現數據保護,那麼沒法很好解決SSD的新問題,例如SSD同時失效問題,而且很難適應大容量存儲盤的發展趨勢。ide

 

爲此,RAID2.0思想能夠被應用於閃存數據保護中。仔細分析,概括起來RAID2.0的核心思想是「數據保護域與物理資源管理域分離」。這種分離與解耦能夠爲數據保護提供更大的靈活性,從而能夠更好的爲數據實現數據保護,而且能夠很容易的實現本地或者遠程的數據保護。傳統存儲軟件架構與RAID2.0軟件架構對好比下圖所示:性能


wKioL1g5rH3CVx_xAADm9SIWuiQ289.jpg


RAID2.0中,經過資源池化的手段對物理資源進行管理。存儲資源池自己不具有數據保護的能力,該資源池被稱之爲「物理資源管理域」。在存儲池之上是存儲對象層,每一個存儲對象被稱之爲ContainerContainerCHUNK構成,每一個Container是一個數據保護單位。所以,存儲對象層也被稱之爲「數據保護域」。因爲Container是一個邏輯對象,與具體存儲盤無關,所以,RAID2.0能夠很靈活的在存儲池之上實現多種不一樣方式的數據保護。與傳統RAID相比,RAID2.0數據保護再也不依賴於物理盤,經過虛擬化的方式將物理資源與數據保護進行了完全的分離。ui

 

相似於RAID2.0這種數據保護技術核心的思想在於將數據保護域從物理資源管理域中分離、獨立。一方面解決了傳統RAID的數據重構問題,大大提升數據可靠性;另外一方面也爲數據保護走向分佈式打下堅實的基礎。在閃存大行其道的今天,RAID2.0技術與閃存結合,能夠很好的解決閃存存儲自身的問題,發揮閃存優點,爲SSD的數據可靠性保駕護航。spa

 

(存儲之道)3d

相關文章
相關標籤/搜索