試論存儲設備歷史源流

         因爲公司業務的關係,本人接觸存儲設備已經有段時間了,也看了先人前輩們關於存儲設備的心得體會。現將本身所學所得匯聚成文,非爲上品,只想將所學零散的知識經過本文的編寫獲得疏理。使慨念更加清晰,也想爲之後的學習工做,及瞭解存儲本源找到方向。
         以前我拜讀並參考了《大話存儲》一書,從盤古開天講到如今,從上古神話時代人們如何存儲信息說到當今社會存儲設備,每一個知識點的講解角度都是標新立意,這位仁兄可謂大才,餘覺得此書受"博大精深"四字亦不爲過,不勝欽佩嚮往之。一樣事物每一個人所講角度與方向不一樣,若是讓我也從神話時代提及,那沒準就真說成神話故事了。所謂這個切入點我想從硬盤提及,如今PC的普及率就不用說了,基本家家必備,那麼有PC必有硬盤,我就從硬盤開始說。並且本文也並不想寫成像"資治通鑑"同樣的編年體史書,那些什麼哪年誰誰誰發明了什麼東東,雖然說前事不忘後事之師,我想咱們應該記住的是前事的因果而並不是死記年限。還有,存儲設備所涉及到的知識點不少,如硬盤原理、接口、文件共享等等不少不少,說到的時候會用簡練的語言說起一些,但不會主要細說哪一塊,真要那樣一篇文章得寫個好幾年。好了,閒言少敘,書歸正傳!

         硬盤,基本上家裏有PC的都知道硬盤,作什麼用的,都知道存數據用的。它怎麼來存呢,這就涉及到硬盤原理。其實把硬盤打開看到硬盤的盤體,就像一落光盤同樣只是邊上多了一個機械部件:
         與光盤不一樣的是,硬盤的盤體上面和下面均可以寫數據。拿什麼來寫,天然是盤體上放置的磁頭,每一個盤體都有,並且上下面都有,這但是十分精密的機器設備,由於磁頭與盤體是有距離的,有多遠?呵呵,你頭髮的粗細與這個距離相比算巨人了,哈。應往哪裏寫呢,就像一張紙,若是有格式咱們就能夠根據格式往上寫字,硬盤也是同樣,盤體是圓形,從最外圍到最裏邊,能夠當作好多個圈圈,叫磁道。每一個圈圈又劃分了好多個段落,叫作扇區。硬盤通電後盤體開始高速旋轉,寫數據時,先找是哪一個盤體,是上面是下面,再找哪一個磁道,最後找到扇區往裏寫數據,讀數據也是同樣。關於原理就說這麼多,有興趣能夠去翻翻書:)
         怎麼讀寫數據知道了,那麼數據從哪裏來呢。看到圖中盤體邊上的接口了嗎,就從接口傳輸進來。從這裏就引出了硬盤接口的類型,以中國來看從九十年代末期到如今共有這麼幾種類型:
IDE
       IDE的英文全稱爲「Integrated Drive Electronics」,即「電子集成驅動器」,一個IDE接口只能接兩個 外部設備。通常用於PC機,最高轉速7200轉。傳輸速度爲:最高 133MB/s硬盤容量最高達 500G,聽說有 1TB,此接口現已淘汰。
SCSI

       小型計算機系統 接口(Small Computer System Interface),一個SCSI可鏈接最多15個外設(包括 磁盤磁帶CD-ROM、可擦寫 光盤驅動器打印機掃描儀和通信 設備等)。鏈接外 平等佔有總線,如今爲止接口傳輸速度最高可達 640MB/s,轉速 7200轉、 10000轉、 15000轉都有, 10000轉性價比最高。鏈接 電纜能夠長達6m。容量最高 300G,現已基本淘汰。
 
SATA

SATA一種基於行業標準的串行接口(Serial Advanced Technology Attachment),來頭不小,是由Intel、IBM等等多家硬盤大佬們共同提出的 硬盤接口規範。接口需主板芯片組支持。支持 熱插拔,傳輸速度快,執行效率高。如今 SATAIII的接口速度最高可達 600MB/s;轉速 7200轉。容量現最高 4TB。是如今PC機與部分存儲設備使用的主流硬盤!  
SAS

SAS(Serial Attached SCSI)即串行鏈接SCSI,是新一代的SCSI技術,改善原SCSI的效能、可用性和擴充性,提供與SATA接口的兼容性。爲適合不一樣硬件環境,接口尺寸有3.5英寸和2.5英寸兩種,一樣轉速 7200轉、 10000轉、 15000轉都有,容量現最高 2TB。傳輸速度 300MB/s,這只是剛起步,預計未來會更高。
NL-SAS
NL-SAS和SAS從技術上來講,沒什麼太大區別。說白了就是使用SATA的盤體,但接口標準是SAS標準。因此轉速最高 7200轉,容量最大是 3TB
 
固態硬盤

固態硬盤(Solid State Disk)用固態電子 存儲芯片陣列而製成的硬盤。接口規範和定義、功能及使用方法上與普通硬盤的徹底相同,在產品外形和尺寸上也徹底與普通硬盤一致。廣泛採用 SATA-2接口及 SATA-3接口,最大容量 128GB,理論最高速度 6Gb/s。分爲兩種:
       一種是採用 閃存FLASH芯片)做爲 存儲介質,即咱們常說的 SSD。最大的優勢就是能夠移動,並且數據保護不受 電源控制,能適應於各類環境,可是使用年限不高;
       另一種是採用 DRAM做爲存儲介質。 仿效傳統硬盤的設計,可被 操做系統文件系統工具進行卷設置和管理,可分爲 SSD硬盤和 SSD硬盤陣列兩種應用。高性能的 存儲器,使用壽命很長,但須要獨立電源來保護數據安全。屬非主流固態硬盤!
 
FC

擁有 光纖通道接口( FC, Fibre Channel)的硬盤, 此接口最初爲互聯網設計,後應用於硬盤接口。硬盤在使用光纖聯接時具備熱插拔性、高速帶寬( 4Gb/s)、 遠程鏈接等特色,可持續性數據傳輸 171MB/s。使用多模光纖聯接時最遠可達 500米;使用單模光纖聯接時最遠可達 10公里。轉速 15000轉,容量最高限制於其高昂的售價, 一般用於高端 服務器領域(自己設計初衷也非民用).

硬盤及接口可算說完了。搞這麼多彷佛有點搶戲,呵呵。由於存儲自己故名思義,就是存儲數據,因此接的都是硬盤,不先說清楚後邊也無法講。就算這樣其實各類接口仍是沒可以說清楚,看來就硬盤應該單開一文多方參考然後撰之~-~
若是上述看不懂也關係,由於都知道PC機內有硬盤,而高端的設備如服務器、小型機、大型機等等也是同樣,不過配置有高有低;有簡單有複雜罷了。那麼咱們試想一下,以服務空爲例:在一個生產環境,服務器若是隻把數據存在本地硬盤裏,那麼須要多少硬盤?多少臺服務器?個人郵件服務器存郵件數據;文件服務器存大批工做文件;網站服務器存站點程序;數據庫服務器存DB數據;要是本地硬盤容量不夠,可不只僅是加硬盤就行的事情,像一些大型網站或數據中心,數據以 TBPB計,這要加多少塊硬盤纔夠?呵呵。服務器自己要工做,還要有頻繁的重要數據讀寫,要是服務器哪個部件出了問題,當機了還算幸運,要是形成數據的損壞可就麻煩了,醫院的病歷、藥品信息;金融的各類金融數據;企業的保祕數據;甚至一個國家的。。。。。。天哪,這得形成多大的損失!一張紙要 800年纔會天然毀滅,還不如純人工手記呢,哈哈。並且搞得數據這裏一份,那裏一份,管理起來至關麻煩。怎麼辦?這個時候,存儲設備就應運而生。
服務器該工做還工做你的,咱們將全部的數據歸攏統一到一個設備或一批設備裏,用一種快捷方便且相對安全的保護機制來保存數據,並且別的不幹只存數據,心無旁騖天然一日千里,這就是存儲設備產生的初衷。內部構造先別想的多複雜,跟服務器差很少,只不過服務器能鏈接的硬盤有限,存儲設備呢,除了主板啊CPU啊等這些主機設備外,畢竟以存數據爲主要工做,因此有這麼一個專門設備(說白了就是一電路板)鏈接好多塊硬盤,只不過這裏管插多少塊硬盤叫多少位,8位就是8塊,12位就是12塊,以此類推~接硬盤的電路板能夠叫它硬盤插槽,8位也叫8 槽位
從存儲設備的前邊來看,瞧瞧,這就是存儲設備的槽位!
而主機設備在這裏叫作 控制器,是由控制器來把外部數據放入到這老些硬盤裏的;固然要想工做必須通電,因此還有電源。簡單地說,存儲設備從硬件來看就這幾樣:控制器、硬盤插槽、硬盤、電源。
這張圖是從存儲的邊後來看,左邊就是控制器,而右邊的是電源
 
從軟件來看呢?剛剛說過,快捷方便且相對安全的保護機制,這種保護機制叫作 RAID
獨立磁盤冗餘陣列( RAID,redundantarray of independent disks,redundantarray of inexpensive disks)怎麼用的呢,那麼多硬盤不能都閒着,把相同的數據存儲在多個硬盤的不一樣的地方。經過把數據放在多個硬盤上,輸入輸出操做能以平衡的方式交疊,改良性能。由於多個硬盤增長了 平均故障間隔時間,儲存冗餘數據也增長了容錯。而這種功能也會軟件兩種:
RAID

磁盤陣列卡-擁有一個專門的處理器與 存貯器,用於高速緩衝數據。使用磁盤陣列卡對磁盤的操做直接經過陣列卡來進行處理,所以不須要大量的CPU及 系統內存資源。但對實施人員水平會有要求。實物見下圖:
RAID
即經過軟件方式來達到硬RAID功能,不一樣的是須要使用CPU及系統內存資源。對實施人員水平倒沒多少要求,其實WINDOWS的磁盤管理就能作,哈。
分類是這兩種,那麼RAID具體的實現方式是什麼呢?就是業內人士常說的什麼 raid1raid0raid5啥的。在 《大話存儲》這本書裏介紹的較全,我只列出經常使用的幾種:
raid0:最先的raid實現方式,其實很簡單,比如說存儲有8塊硬盤,我把數據分散存到這8塊硬盤上,不是分文件而是分散,一個文件被拆成多個部分分別存在多個硬盤上。但在應用層看到仍是完整的文件,至少需 塊盤。缺點是萬一哪塊硬盤壞了,全完了,哈哈。
raid1:叫作磁盤鏡像,數據在寫入一塊磁盤的同時,會在另外一塊閒置的磁盤上生成鏡像文件,保證系統的可靠性和可修復性,只要系統中任何一對鏡像盤中至少有一塊磁盤可使用,系統均可以正常運行,至少也需 塊盤。雖然這樣對數據來說很安全,可是成本也會明顯增長,甚至形成浪費!
raid1與raid0配合使用:上述 raid1的缺點,在同一時間內只能向一塊磁盤寫入數據,不能充分利用全部的資源。爲了解決這一問題,咱們能夠把RAID0和RAID1技術結合起來,有 raid1+0raid0+1兩種模式。
raid1+0—是先作鏡像再作條帶,以四塊硬盤爲例,兩組raid1,再將兩個盤組作raid0,raid1兩盤組各壞一塊盤還能用繼續用。因此至少需四塊硬盤。
raid0+1—是先作條帶再作鏡像,一樣以四塊硬盤爲例,兩組raid0,將兩盤組作raid1,若兩盤組各壞一塊盤就不能用了,但若是一個盤組的兩塊盤都壞了,仍是能夠繼續用。
相比之下,raid10比raid01要可靠,raid01的寫速度要快。
raid5:分佈式奇偶校驗的獨立磁盤結構,好複雜的名字。。。。。每塊盤的數據有其對應的 奇偶校驗信息, RAID 5不對 存儲的數據進行備份,而是把數據和與其相對應的 奇偶校驗信息存儲到組成RAID5的各個磁盤上,且奇偶校驗信息和相對應的數據分別存儲於不一樣的磁盤上。當 RAID5的一個磁盤數據損壞後,利用剩下的數據和相應的 奇偶校驗信息去恢復被損壞的數據。最少 塊盤!
raid6:帶有兩種分佈存儲的奇偶校驗碼的獨立磁盤結構,更復雜的名字。。。。。天。與 RAID 5相比, RAID 6增長了 第二個獨立的 奇偶校驗信息塊。兩個獨立的校驗系統使用不一樣的算法,即便兩塊磁盤同時失效也不會影響數據的使用。但RAID 6須要分配給 奇偶校驗信息更大的磁盤空間,因此與RAID5相比,實際應用很少。至少 需塊盤
說到這裏,存儲設備的硬件和軟件大至聊完了,其光是存儲的 內設與raid也夠寫好幾篇博客了,哈,有空再說。簡單地說就是一大堆硬盤和主機設備 在一塊兒經過 raid方式存儲數據。那這些數據是怎麼 的呢?天然是經過服務器與存儲進行數據通迅來的,如何進行數據通迅的呢?這又引出了存儲與服務器的 鏈接!
最先的存儲設備,我們追溯到 IDE硬盤的年代,那個時候服務器硬盤不少都是SCSI接口,在服務器的主板PCI接口上插入 SCSI,SCSI卡的接口用數據線與 SCSI硬盤鏈接。而存儲呢,那個時候直接連服務器,用的什麼呀?天然也是SCSI接口鏈接服務器的SCSI卡,叫作 直連存儲
圖爲 SCSI
後來隨着 互聯網的興起,纔有了應用到網絡的存儲設備,說白了就是SCSI接口改了 RJ45口,服務器與存儲設備都鏈接 交換設備進行數據通迅,而SCSI卡天然就免了。再到後來(其實也沒多久),由於百兆網絡升級成千兆以極萬兆或光纖環境,那RJ45口天然也跟着 升級,因此存儲設備後來也有千兆接口的、光纖口的。這些除了光纖與萬兆口外,其它兩個看着差很少:
如上圖所示:百兆、千兆口就是那兩個RJ45口,外表沒什麼變化,只是接口速度不一樣。百兆是 100Mb/s,實際應用上 10MB到頭了;千兆是 1000Mb/s,實際應用也就 100MB
而圖中右邊的 個接口,看着跟 8個窟窿眼兒外加鐵架子同樣的就是光纖口。要提及光纖口那又多了去了,也是從互聯網技術而來。我只說如今存儲經常使用的 光纖口,純光纖與模塊光纖。
先說 純光纖:FC(Fiber Channel),應用光環境的存儲設備與服務器。在整個網絡傳輸時,通常像文件共享啦、FTP啥的,走的都是微軟的TCP/IP。而FC協議不在這以內,從物理層到應用層有本身的數據傳輸協議,叫作類以太網協義。也是基於網絡實現的。而 純光纖接口,也叫 FC口,是固化在存儲控制器主板上的。速度 8Gb/s

模塊光纖:與純光纖口同理,模塊是指能夠將光纖接口取出,換成 RJ45網絡模塊
 
我們在看一個存儲設備參數時,若是有 萬兆網口,這個接口就是插槽,能夠插光纖模塊,也能夠換成的 RJ45的萬兆模塊,萬兆模塊長什麼樣,接口就是RJ45,身體跟上圖光模塊同樣。速度嘛, 10000Mb/s1000MB左右。
到這裏,算是簡單說完了存儲設備與服務通迅的接口,其實每個都有不低的技術含量,互聯網技術與存儲技術的相互融合帶來了存儲通迅上至關大的飛越!但光是存儲飛越不行,一樣的環境,服務器也要有相應的設備才能同時飛越,存儲是光口,存儲仍是網口,根本就沒法工做。
       千兆網環境,存儲的網口要是千兆的;交換設備接口要是千兆的;服務器網卡要是千兆的;甚至連網線也要六類線才行。
       萬兆網環境同理,只不過物理線路尚未那麼快,只是 接口速度提高了。
從這裏引伸出一律念叫作 SAN存儲區域網絡,不單止一臺存儲,而是多臺存儲設備組成的工做局域網,而網絡環境是上述千兆或萬兆,物理線路是網線的叫作 IP SAN
       光環境,這裏要說一下,無論存儲是純光纖接口亦或是光纖模塊,交換設備接口必須是光纖口;而服務器方面要在主板上插光纖卡,叫作 HBA卡。
關於 HBA卡:(Host Bus Adapter)光纖存儲卡,用於服務器與光纖陣列規的鏈接
上圖的 HBA卡,左邊爲雙接口帶一個冗餘接口,就是一個壞了還能繼續用;右邊的很少說了。將 HBA卡接到服務器主板上,裝好驅動就能夠用了。
而在光環境下的存儲設備—交換設備—服務器的鏈接線是什麼呢?天然是 光纖線,見下圖:
上邊所提到的 存儲區域網絡,多臺存儲設備組成的工做局域網,網絡環境是光纖,光交換設備、光纖接口,物理線路是光纖線,叫作 FC SAN
 
各類環境的鏈接應用也算簡單說完了,至於具體的參數啊型號啊,要是再說這些估計還沒說完我就完了,我的認爲一邊深刻了解原理一邊根據需求看型號參數比較好。好的,以上說完了存儲的硬件、存數據的方式、各類應用環境,不一樣的應用環境天然設備不一樣,那麼存儲設備在對應不一樣的應用環境會有哪些不一樣的設備,這是接下來也是最後一個話題,存儲的分類!
 
正所謂物以類聚,人以羣分。如今來講說存儲設備的分類,任何產品都有不一樣的受衆羣,一樣一本"西遊記"也有少兒讀本與成年人讀本之分;像PC或筆記本適合普通大衆;服務器適合工程使用;哪怕說人-還分三六九等呢,是否是。存儲設備也是同樣,但怎麼來區分呢?就兩個字: 需求!家裏就上上網看看電影啥的,買臺服務器回家?新浪網的訪問量如此之大,就用PC當作網站服務器?那真是吃飽了撐的,這些固然是不合適的。因此說要根據不一樣的應用環境與技術標準來決定產品的受衆與分類。存儲設備的分類從需求來講分爲三種:
在線存儲

在線存儲也稱作盤陣,故名思義就是要時刻保持在線狀態,讀寫數據頻繁,工做環境對存儲的性能要求頗高。所謂頗高是指控制器的配置要高;並且最少都是 雙控制器(以上),能夠外接 擴展櫃;接口基本上使用的是 FC接口;硬盤嘛, SATA的有, SASNL的有, SAS的有, 光纖接口硬盤的也有。因此其工做環境,交換設備基本都是光纖或千兆網(包括萬兆)設備,服務器天然也配有光纖卡( HBA),從應用層認到的存儲設備是 SCSI卷。盤陣的raid機制都是 raid
還有一種叫作 iSCSI盤陣,控制器與硬盤與上述相同,也是作 raid但接口都是千兆網或萬兆網,這就說明網絡協議走的都是 TCP/IP協義,應用層認到的設備是 iSCSI設備。說到這裏有幾名詞須要解釋:
擴展櫃—就是安裝硬盤用的櫃子,只是做爲容量 擴展單元,不能作爲獨立部件使用。 通常與存儲設備配合工做;外型有塔式、全鋁合金桌面型設計,能夠容納5-12顆硬盤,與再購買一臺存儲相比,更能 節省機櫃的空間。
SCSI設備-SCSI硬盤已經聊過了,那麼SCSI設備是什麼,盤陣將全部硬盤空間作成 raid存儲方式,這時應用層所看到和真正使用用的是一塊盤或幾塊 SCSI硬盤注意:不是分區!並且將存儲設置好以後,在服務器應用層是 自動認到,比如說在windows的磁盤管理裏會自動跳出認出新設備的窗口:)至於 iSCSI是什麼,這就要說到 近線存儲
 
近線存儲  

指將那些並非常常用到,或者說數據的訪問量並不大的數據存放在性能較低的存儲設備上。近線存儲對性能要求相對來講並不高,因爲不經常使用的數據要佔總數據量的比較大的比重,這就要求近線存儲設備的容量需求相對較大。比如說給一些長期保存的不經常使用的文件作歸檔。上述實現這種概念的設備叫作 NAS,即 網絡附加存儲
歸檔—就像咱們把不經常使用的東西收拾起來裝好同樣,這透出一個歸字。數據也是同樣,我自己的盤陣不留這些數據,將這些數據歸檔存儲到近線設備上。只是這裏需求不一樣,有些環境歸檔不要求時常能讀取到這些數據;有些是要求的;而有些不只要求還要與在線數據同步。其實歸檔只是個概念或目地,實現其目地的技術手段統稱叫作 備份。既然提到了歸檔,那索性就再說說備份的幾種機制。
備份—其實不管是什麼存儲設備,目地都是存數據,除了最原始的拷貝以外,還有幾種很智能的備份機制。
增量備份—咱們先把數據備份到存儲設備上來,下一次再備份的時候若是隻是拷貝過來,那麼會有大量地數據重複覆蓋。增量備份的機制就是已有的數據不備份,只備份新增長的數據。
數據同步—要求存儲設備上備份的數據與原始數據保持一致,它增我增,它減我也減。
實際上述幾種備份機制時,還能夠根據時間即 年、月、日,甚至有的設備還提供 時、分時間機制,可 定時作備份。
NAS通常提供最基本的兩種服務, iSCSI盤與文件共享。先說文件共享,由於大多數人離這個名字較近,用過WINDOWS的人基本上或多或少接觸過共享目錄共享分區,只不過NAS因此提供的更多,除WINDOWS外,Linux的 NFS、MAC的 AFP,還有 telnetFTP等等。
iSCSIInternet 小型計算機系統接口 (Internet Small Computer System Interface)是 IBM大佬研發的,該技術是將現有 SCSI 接口以太網絡(Ethernet)技術結合,供硬件設備使用實如今 IP網絡上運行SCSI協議,使其可以在 以太網上使 服務器可與使用IP網絡的儲存裝置互相 交換資料。在需訪問資源的客戶端應用層認到的是 iscsi,不過這可不像盤陣,須要應用層用 iscsi發起器來掃描並鏈接設備,發起器在windows7有自帶,Linux有相關命令。
除上述兩種功能外,NAS還提供相應的 優化存儲資源的功能,好比說像數據刪重,即將重複數據取出,這樣能夠節省空間;在線擴容,不間斷工做,更換NAS的硬盤等等。這些功能同指化嚴重,基本上企業級NAS都有,只不過有些NAS須要購買序列號激活功能而有些不用罷了。
除功能之外,NAS不像盤陣,不光是機架式的,也有 塔式的,如圖所示:
因此其應用較廣,除生產環境外,公司部門甚至我的用戶也能夠用獲得。而控制器、接口、硬盤接口等性能方面,根據需求的不一樣,配置天然也不一樣,通常都分爲 低、中、高端三類,配置天然也是 由低到高,甚至在特定的環境裏高端NAS也能夠當作低端盤陣來用。這一切要以 需求出發,不過需說明NAS的 raid機制,不像盤陣都是硬raid,有些是 raid;有些是 raid
 
離線存儲
         離線存儲設備在業內全部存儲設備當中算是較 特殊一種,能夠說無論是與盤陣仍是NAS相對獨立(那二位好歹還有點關係)。先說說它的 需求來源,即企業的 大數據需長期保存。比如說金融行業的數據,我國規定是要保存十年以上,這是根據行業規則來的需求;再好比說醫院的數據,無論是各項檢查的數據仍是病人病歷以及藥品數據,這些數據中的一部分是不常常讀寫,甚至會放置好久,這些數據若是隻放在盤陣或NAS裏,由於設備會常常有讀寫數據操做,我說過存儲設備的安全機制是相對安全,對於在生產環境設備將來會出現什麼問題,咱們人爲的預估只能佔部分比例,畢竟這世上就沒有什麼絕對的事情,既然設備會常常有讀寫操做,那就難保會出問題,出問題的結果每每致使了數據損失,有些數據損失又會是致命的,因此怎麼辦呢,正所謂 一動不如一靜!真要保證數據安全的方法每每靜止不動,要是這些須要長期保存而長時間不會讀寫的大量數據所放置的設備,不像盤陣或NAS那樣常常被讀寫,只在須要的時候被導入到在線或近線亦或是服務器本地硬盤,這樣問題就解決了,因此離線存儲設備就這樣應運而生。
         所用的設備是什麼呢?在我國八十年代末九十年代初,錄像機與錄音帶能夠說是風靡大江南北,能夠聽歌、錄像、看錄像,其實所記錄的音頻與影像資料其實就是數據,因此加以改動同樣能夠應用到存儲設備上,名稱也不同了。錄像帶叫磁帶、錄像機叫磁帶機(也叫磁帶驅動器)、後來又有了相對智能的磁帶設備叫磁帶庫、再後來甚至有了用盤陣作爲底層存儲的虛擬帶庫。
磁帶
         可以存儲數據的磁帶跟錄像、錄音帶同樣,也用的是膠片來記錄數據,當開始寫數據時,就像錄音帶開始錄音同樣,順序寫入,當開始隨機檢索時天然也像錄音帶同樣倒帶。只是爲了與應用層配合使用,業內開發了多種能夠數據交互的協議,好比說像常見的 LTO即線性磁帶開放協議,提供對磁帶數據的寫入、檢索、糾錯等等功能。說到這裏,到底爲何使用磁帶其實還不是徹底清楚,上述說大數據量長期存儲,基於這點就引起出兩點緣由,一是如今 20TB以上和 PB級的數據作離線來講,就磁帶與硬盤相比較,磁帶的性價比很是高;二是磁帶與硬盤在應用上最大的不一樣是,磁帶寫滿數據後,能夠自動彈出而後保存起來,放保險箱裏或安全妥帖的場所,這就符合了需求來源中所提到的一動不如一靜!說到這裏又產生了一個問題,那麼磁帶是被什麼設備讀寫數據而後彈出的呢?這種設備叫磁帶機!
 
磁帶機

       磁帶就像錄像帶;那麼磁帶機也就如同錄像機。錄像機把影像數據存到錄像帶上,也能夠把錄像帶上的影像數據放映出來,錄完像或放映完錄像帶從錄像機裏取;磁帶機也一樣能把數據寫入到磁帶上,一樣能夠把磁帶上的數據恢復回來,磁帶機也一樣能把磁帶 彈出作離線保存。如今磁帶機(也叫磁帶驅動器)分兩種,一種是手動將磁帶放入磁帶機;一種是自動放入,叫自動加載機,帶磁帶卡槽。從廣議上來說,自動加載機其實算不上真正意義上的磁帶機,而應屬於一種叫 磁帶庫的產品。
磁帶庫
       磁帶庫,先理解'庫'這個字的含義。像車庫、庫房之類,那麼以此類推磁帶庫裏應該會放置不少個磁帶(即磁帶卡槽)與磁帶機,這很像上述所說的自動加載機:
       自動加載磁帶機是一個位於單機中的磁帶 驅動器和自動磁帶更換裝置,它能夠從裝有多盤磁帶的磁帶匣中(就是磁帶卡槽位)拾取磁帶並放入驅動器中,或執行相反的過程。能夠備份 100GB—200GB或者更多的數據。
       而磁帶庫是指像自動加載磁帶機同樣的基於磁帶的 備份系統,磁帶庫由多個磁帶 驅動器、多個槽、 機械手臂組成,由機械手臂自動實現磁帶的拆卸和裝填(就像人手同樣,拿出磁帶放入磁帶機)。它可以提供一樣的基本 自動備份數據恢復功能,而且能夠多個 驅動器並行工做,也能夠幾個驅動器指向 不一樣的服務器來作備份,存儲容量達到 PB級,可實現連續備份、自動搜索磁帶等功能,可在 應用層 管理軟件的支持下實現智能恢復、實時監控和統計,能夠說大型 數據備份的主要設備。
虛擬帶庫VTL(Virtual Tape Library  )
       說到磁帶的時候提到過,磁帶作離線備份的緣由之一是由於大數據量存儲,磁帶與硬盤的性價比高。磁帶機與磁帶庫是很昂貴的,但一樣20T以上的數據量來看磁帶仍是比硬盤要便宜。那麼隨着硬盤 價格的不斷降低,業內也在尋找一種硬盤替代磁帶的方法,畢竟磁帶雖然比較實惠,但其 保存環境較爲嚴格,並且要是摔一下基本上不能用了。這個時候,虛擬帶庫就產生了, 帶庫兩個字指的就是磁帶庫,而虛擬二字指的是 虛擬出來的磁帶庫!也就是說是以其它存儲設備作 實際數據存放,但 存儲方式是磁帶庫的備份方式。最開始的時候虛擬帶庫,是將盤陣與服務器 直連,在應用層安裝 虛擬帶庫軟件,將盤陣 虛擬成磁帶庫設備,那麼在應用層備份軟件中所 認到的設備就不是盤陣而是磁帶庫;後來隨着 IP SAN的應用,發展成虛擬帶庫的獨立設備,將虛擬帶庫的軟件寫入到盤陣或其它非磁帶設備的電路板 芯片中,讓其它自身提供虛擬磁帶庫工做模式,而不倚賴於應用層可自成一體。但虛擬帶庫有一個自然 缺餡,既然是將盤陣作當底層存儲設備,那麼不能像磁帶那樣將磁盤取出,虛擬環境看到的是取出,但其實沒有。除非虛擬帶庫 鏈接真實磁帶庫才能作真正地底層設備離線。

小提一句:
       原本關於存儲分類說到磁帶設備應該就說完了,但最近我忽然發現一個作離線的設備用的是虛擬帶庫的工做方式,能夠作到將硬盤像磁帶那樣 彈出,底層設備也能作到離線二字。特地在結尾小提一句,這個設備叫作 RDXA8:
       這個設備有 8個槽位,裏面插入的是筆記本硬盤,只不過外邊有一層扛摔的外殼,是 SATA接口。設備的工做模式之一就能夠提供 虛擬帶庫的工做方式,虛擬出8個磁帶卡槽、 機器手,但磁帶機只能虛擬出 個,可見是作 小數據量離線備份用的。
 
好了,長出一口氣,這篇博客可算寫完了,呵呵。我算了算時間,從 2013年4月13日早上11點開始寫,一直寫到了。。。。如今是 2013年4月14日14點34分,基本上用了一個工做日的時間。 硬盤到存儲設備的產生,再到 設備接口與應用硬件環境,最後是 存儲設備分類,將整個歷史源流疏理一遍。其實有不少沒說清楚,像硬盤的各類接口、存儲設備實際在工做時的數據走向流程,比較深挖的東西沒有說到,還有像網絡光纖與存儲光纖的驅別種類這些也算是沒說到的。但初衷還算達到了,我原本想整理的就是存儲設備的源流,仍是偏硬件一些;之後有機會會把這篇中提到的不少知識點細化再編寫成文。有這方面的高手歡迎指點,餘當虛心求教之,謝謝~!
相關文章
相關標籤/搜索