在單機時代,採用單塊磁盤進行數據存儲和讀寫的方式,因爲尋址和讀寫的時間消耗,致使I/O性能很是低,且存儲容量還會受到限制。另外,單塊磁盤極其容易出現物理故障,常常致使數據的丟失。所以你們就在想,有沒有一種辦法將多塊獨立的磁盤結合在一塊兒組成一個技術方案,來提升數據的可靠性和I/O性能呢。算法
在這種狀況下,RAID技術就應運而生了。安全
1、RAID 是什麼?併發
RAID ( Redundant Array of Independent Disks )即獨立磁盤冗餘陣列,簡稱爲「磁盤陣列」,其實就是用多個獨立的磁盤組成在一塊兒造成一個大的磁盤系統,從而實現比單塊磁盤更好的存儲性能和更高的可靠性。性能
2、RAID 有哪些?設計
RAID方案常見的能夠分爲:blog
RAID0
RAID1
RAID5
RAID6
RAID10
下面來分別介紹一下。效率
RAID0基礎
RAID0 是一種很是簡單的的方式,它將多塊磁盤組合在一塊兒造成一個大容量的存儲。當咱們要寫數據的時候,會將數據分爲N份,以獨立的方式實現N塊磁盤的讀寫,那麼這N份數據會同時併發的寫到磁盤中,所以執行性能很是的高。原理
RAID0 的讀寫性能理論上是單塊磁盤的N倍(僅限理論,由於實際中磁盤的尋址時間也是性能佔用的大頭)高可用
但RAID0的問題是,它並不提供數據校驗或冗餘備份,所以一旦某塊磁盤損壞了,數據就直接丟失,沒法恢復了。所以RAID0就不可能用於高要求的業務中,但能夠用在對可靠性要求不高,對讀寫性能要求高的場景中。
那有沒有可讓存儲可靠性變高的方案呢?
有的,下面的RAID1就是。
RAID1
如圖,
RAID1 是磁盤陣列中單位成本最高的一種方式。由於它的原理是在往磁盤寫數據的時候,將同一份數據無差異的寫兩份到磁盤,分別寫到工做磁盤和鏡像磁盤,那麼它的實際空間使用率只有50%了,兩塊磁盤當作一塊用,這是一種比較昂貴的方案。
RAID1其實與RAID0效果恰好相反。RAID1 這種寫雙份的作法,就給數據作了一個冗餘備份。這樣的話,任何一塊磁盤損壞了,均可以再基於另一塊磁盤去恢復數據,數據的可靠性很是強,但性能就沒那麼好了。
瞭解了RAID0和RAID1以後,咱們發現這兩個方案都不完美啊。
這時候就該 性能又好、可靠性也高 的方案 RAID5 登場了。
RAID5
這是目前用的最多的一種方式。
由於 RAID5 是一種將 存儲性能、數據安全、存儲成本 兼顧的一種方案。
在瞭解RAID5以前,咱們能夠先簡單看一下RAID3,雖然RAID3用的不多,但弄清楚了RAID3就很容易明白RAID5的思路。
RAID3的方式是:將數據按照RAID0的形式,分紅多份同時寫入多塊磁盤,可是還會另外再留出一塊磁盤用於寫「奇偶校驗碼」。例如總共有N塊磁盤,那麼就會讓其中額度N-1塊用來併發的寫數據,第N塊磁盤用記錄校驗碼數據。一旦某一塊磁盤壞掉了,就能夠利用其它的N-1塊磁盤去恢復數據。
可是因爲第N塊磁盤是校驗碼磁盤,所以有任何數據的寫入都會要去更新這塊磁盤,致使這塊磁盤的讀寫是最頻繁的,也就很是的容易損壞。
RAID5的方式能夠說是對RAID3進行了改進。
RAID5模式中,再也不須要用單獨的磁盤寫校驗碼了。它把校驗碼信息分佈到各個磁盤上。例如,總共有N塊磁盤,那麼會將要寫入的數據分紅N份,併發的寫入到N塊磁盤中,同時還將數據的校驗碼信息也寫入到這N塊磁盤中(數據與對應的校驗碼信息必須得分開存儲在不一樣的磁盤上)。一旦某一塊磁盤損壞了,就能夠用剩下的數據和對應的奇偶校驗碼信息去恢復損壞的數據。
RAID5校驗位算法原理:P = D1 xor D2 xor D3 … xor Dn (D1,D2,D3 … Dn爲數據塊,P爲校驗,xor爲異或運算)
RAID5的方式,最少須要三塊磁盤來組建磁盤陣列,容許最多同時壞一塊磁盤。若是有兩塊磁盤同時損壞了,那數據就沒法恢復了。
RAID6
爲了進一步提升存儲的高可用,聰明的人們又提出了RAID6方案,能夠在有兩塊磁盤同時損壞的狀況下,也能保障數據可恢復。
爲何RAID6這麼牛呢,由於RAID6在RAID5的基礎上再次改進,引入了雙重校驗的概念。
RAID6除了每塊磁盤上都有同級數據XOR校驗區之外,還有針對每一個數據塊的XOR校驗區,這樣的話,至關於每一個數據塊有兩個校驗保護措施,所以數據的冗餘性更高了。
可是RAID6的這種設計也帶來了很高的複雜度,雖然數據冗餘性好,讀取的效率也比較高,可是寫數據的性能就不好。所以RAID6在實際環境中應用的比較少。
RAID10
RAID10其實就是RAID1與RAID0的一個合體。
咱們看圖就明白了:
RAID10兼備了RAID1和RAID0的有優勢。首先基於RAID1模式將磁盤分爲2份,當要寫入數據的時候,將全部的數據在兩份磁盤上同時寫入,至關於寫了雙份數據,起到了數據保障的做用。且在每一份磁盤上又會基於RAID0技術講數據分爲N份併發的讀寫,這樣也保障了數據的效率。
但也能夠看出RAID10模式是有一半的磁盤空間用於存儲冗餘數據的,浪費的很嚴重,所以用的也不是不少。
總體對比一下 RAID0、RAID一、RAID五、RAID六、RAID10 的幾個特徵: