數據安全筆記

導讀與大綱

2020/03/10html

數據備份 -> 防止災難、意外事故形成損失前端

數據恢復 -> 災難發生後,儘量拯救數據node

網站推薦:

https://www.dgxue.com/huifu/ 數據恢復迷linux

數據備份

數據存儲介質

  • 硬盤、磁帶、光盤
    • 主流與趨勢
    • 市場調查

存儲系統結構(重點)

  • 存儲系統結構(重點)
    • DAS、NAS、SAN
      • 各個存儲架構的組成、技術特色、應用
      • 可以設計合理的存儲架構

存儲新技術

  • 虛擬化、節能技術
    • 分級存儲於管理、數據自動遷移、重複數據刪除技術、自動精簡配置、MAID技術
    • 可以根據須要使用配置相關技術

數據容災技術(重點)

  • 容災系統、容災策略及方案
    • 可以設計合理的數據容災系統

數據恢復

磁盤內部物理和邏輯結構

  • 磁盤部件git

  • 工做原理算法

  • 邏輯結構劃分數據庫

  • 分區設定(難點)windows

FAT文件系統(難點+重點)

  • 系統結構
  • 文件記錄方式
  • 數據存儲方式
  • 數據的查找與恢復

NTFS文件系統(難點+重點)

windows主流文件系統後端

  • 系統結構
  • 文件記錄方式
  • 數據存儲方式
  • 數據的查找與恢復

RAID磁盤陣列(難點+重點)

  • 陣列類型瀏覽器

  • 特色與參數

  • 陣列恢復方法

數據恢復工具

  • PC3000

  • Winhex

    16進制編輯軟件

  • 其餘數據恢復軟件

    傻瓜式恢復軟件


數據備份 - 數據存儲介質

光存儲設備

光存儲設備常被簡稱光驅,光存儲設備所使用的存儲存放介質被稱爲光盤,因爲其存儲容量大、價格便宜、保存時間長,是許多軟件和數據採用的存儲介質。從CD、DVD再到HD DVD和BD,光盤存儲量愈來愈大,技術也愈來愈先進

光存儲設備的種類

光存儲設備分爲臺式內置光驅、筆記本內置光驅、外置通用光驅三種

  • 臺式內置光驅

    臺式內置光驅安裝在主機箱內部,是DIY市場中最爲廣泛的光存儲產品類型

  • 筆記本內置光驅

    筆記本內置光驅強調薄、輕、省電、價格高,其牢固度要遠低於臺式機內置
    光驅

  • 外置通用光驅

    外置通用光驅則是經過外部接口鏈接在主機上,主要是針對須要移動工做的
    用戶,更多的是強調移動性,在性能、其數據傳輸率、體積、重量等方面都
    受到制約,要遜色於內置式光驅,並且價格要遠遠高於內置式

按讀寫光盤的類型分類

  1. DVD-DOM驅動器

    一種能夠讀取DVD盤片的光驅,兼容DVD-ROM、CD-ROM等常見的格式

    DVD-ROM驅動器分臺式機內置型、筆記本內置型和外置型三種

    DVD的單倍速是指1358KB/s,而CD的單倍速是150KB/s,大約爲
    CD的9倍

    目前DvD-ROM驅動器所能達到的最大DVD讀取速度是18倍速最大數據傳輸率爲27MB/S,緩存容量從198K至256K不等。接口類型有IDE和SATA兩種。安裝方式份內置和外置兩種

  2. DVD刻錄機

    可寫光盤

    DVD刻錄規格並無簡歷起統一的規格,目前有三種不一樣的刻錄規格:DVD-RAM、DVD-R/W、DVD+R/W,並且三種規格相互不兼容,主流爲DVD-R/W、DVD+R/W

    目前多數刻錄機都支持 DVD-ROM,DVD+R DL,DVD+R,DVD+RW. dVD-R DL,DVD-R,DVD-RW,DVD-RAM,DVD Video,CD-ROM,CD-R,CD-RW等多種類型

  3. 藍光刻錄機

    藍光刻錄機是基於藍光DVD技術標準的刻錄機
    DVD使用MPEG2壓縮技術,能夠存儲廣播級效果的電影

光存儲設備的工做原理

  1. 光存儲設備的外部結構

    image-20200310112122566

    image-20200310112122566

  2. 讀取數據的工做原理

    • 光盤上存在着凹點和凸點
      凹0 凸1,突起的地方表示1,凹陷的地方表示0

      詳細:光盤上存在着「凹點」和「凸點」兩種狀態,它們的反射信號正好相反,這兩種不一樣的信號很容易就能被光監測器識別,在光驅中有專門的部件將它們轉換並校驗,再交給光存儲設備中的控制芯片處理,而後就會在計算機中獲得光盤中的數據。

    • 不一樣類型的光盤主要區別是激光頭產生的不一樣波長

      激光頭會產生0.54μm~0.78μm

    • 激光波長:

      • DVD:650nm
      • CD:780nm

    image-20200310112435997

  3. 刻錄數據的工做原理

    只有具有刻錄光盤功能的光存儲設備才能在特定的光盤中刻錄數據。
    CD刻錄機是在 CD-ROM的基礎上發展起來的光存儲設備,可刻錄的光盤類型有CD-R光盤和CD-RW光盤

    DVD刻錄機是在DVD-ROM的基礎上發展起來的光存儲設備,可刻錄的光盤類型有DVD-R、 DVD-RW、 DVD-R DL、DVD+R、DVD+RW、DVD+R DL、DVD-RAM、CD-R、CD-RW等9種格式的光盤。

    具體過程:可刻錄光盤是在聚碳酸酯製成的片基上噴塗了一層染料層,激光頭根據刻寫數據的不一樣控制發射激光束的功率,使部分染料受熱分解,在空白的光盤上用高溫「燒刻」出可供讀取的反光點,因爲染料層分解後不能復原,所以DVD-R光盤只能燒刻一次,而RW因爲染料層的不一樣,能夠反覆刻寫。

    image-20200310112641593

  4. 光存儲設備的性能指標

    衡量光驅性能指標的最重要參數是數據傳輸率,其餘還有平均尋道時間、數據傳輸模式、CPU佔用時間、緩存容量以及
    糾錯能力等。

    1. 倍速

      1. CD-ROM基準倍率爲150Kb/s(1x) 如50x光驅的數據傳輸速度爲7.5MB/s
      2. DVD基準倍率爲1.35MB/s(1x) 如20x光驅的數據傳輸速度爲27MB/s
      3. BD-ROM基準倍率爲4.5MB/s(1x)

      最大數據傳輸速度指激光頭在光盤最外圈讀寫數據所達到的最大值,光盤內圈數據傳輸速度大約爲外圈的一半左右。

    2. 多格式支持

      DVD-ROM光盤驅動器能支持和兼容讀取多種盤片

    3. 緩存容量

      高,所以緩存容量對光驅的性能影響至關大。目前普通光驅大多采用198KB256K緩存容量,而刻錄機通常採用28MB緩存容量。

    4. 接口類型

      市面上主要有IDE、USB、SCSI和SATA,SCSI接口的CD-ROM價格較貴、安裝較複雜,且須要專門的轉接卡

      如今的DE接口的傳輸速率最高可達133MB/s,SATA150接口的傳輸速率最高可達150MB/s,而18倍速的 DVD-ROM的實際須要的速度只有18*1358KB/s=24.444MBs,選用哪一種接口基本都能知足傳輸速度要求。

    5. 糾錯能力

      光驅對一些數據區域不連續的光盤進行讀取時的使用能力。

      其中對比明顯爲兼容性差的國外的光驅不能讀取盜版的光盤,而國內的光驅兼容性強能夠讀取盜版光盤

    6. 震動、噪音和發熱

光驅常見故障

image-20200310112641593

光盤概述

優勢:

寫入後不可修改,成本中等,維護成本低

  • 成本低
    • 每張成本不過一兩元甚至更低
  • 使用壽命長!
    • 合理使用通常會在100年左右
    • 抗干擾能力強
  • 便於攜帶

光盤的分類

  1. CD-ROM光盤

    image-20200310112641593

  2. DVD-ROM光盤

    DVD-ROM光盤的容量是CD光盤的7倍,爲了在相同面積內裝載更多內容,DVD光盤釆用了更高密度的(螺旋)軌道間隙設計,從以往CD的1.6微米減少至0.74微米。數據凹槽的(寬度)尺寸從CD的0.83微米縮小到0.40微米。更小的數據凹槽須要更短波長的光束才能正確讀取,所以DVD使用了640納米波長的激光束(而CD的激光波長則爲780納米).存儲一部長度爲135分鐘的電影一般須要4692Kbps的速率。換算成容量單位即爲4.75GB,所以以此爲標準規定了DD光盤的最初容量。

    image-20200310112641593

  3. 刻錄機

    除了只能讀不能寫的只讀型ROM( Read-Only Memory,只讀存儲器)光盤外,還有可寫一次-R( Recordable,可記錄)與反覆擦寫RW(ReWritable,可重寫)的光盤。它們除了能夠被讀取以外,還都可以寫入數據。
    CDR/DVD±R與 CD-RW//DVD+RW之間的差異是:±R只能寫一次,不能擦掉後重寫;而±RW則能夠反覆擦寫。

DVD盤片格式分類

  1. DVD-RAM規格
  2. DV-RW
  3. DVD+RW
  4. DVD-R與DVD+R
  5. DVD-Multi與DVD-Dual

其中+R好過-R,-R光頭定位進度低尋址方式的信號識別度較差,+R則精度高尋址方式比前者好

image-20200310112641593

image-20200310112641593

BD與HD的藍光盤
  • BD

    藍光盤的容量大,添加了硬質塑料或聚合物外殼,盤片的保護性好;但與現有DvD不兼容,並且製做成木較髙,播放機的銷售價格也較貴
    BD視盤採用的是MPEG二、MPEG4/AVC(H.264)和VC-1視頻編碼,音頻則採用了 Dolby Digital(AC3)、DTS和LPCM(可達7.1聲道)編碼,可選 Dolby Digital Plus和無損的Dolby TrueHD與 DTS HD

    image-20200310112641593

  • HD

    HD DVD採用MPEG-4AVC、VC-1和MPEG2視頻編碼,採用DolbyDigital Plus、DTS、 Dolby digital(AC3)和 MPEG Audio等有損編碼和LPCM、MLP( TRUE HD雙聲道]和 DTS HD等無損編碼

光存儲設備選購指南

  1. 品牌

    售後

  2. 讀盤能力

    單激光頭和雙激光頭

  3. 接口和緩存

    IDE和SATA,推薦SAA

  4. 區碼的限制

  5. 倍速

  6. 多格式支持

刻錄機的選購

  1. 兼容性
  2. 穩定性
  3. 關頭系統
  4. 讀寫倍速
  5. 區碼問題
  6. 售後服務

磁帶存儲技術

  • 磁帶存儲器的讀寫原理基本上與磁盤存儲器相同,只是他的載體是一種帶狀塑料叫作磁帶,寫入時可經過磁頭把信息代碼記錄在磁帶上,當記錄代碼的磁帶在磁頭下移動時,就可在磁頭線圈上感應出電動勢,即讀出信息代碼
  • 磁帶存儲器由磁帶機和磁盤兩部分組成

發展歷程

1949年,磁帶從實驗室誕生,1952年,IBM的第一個磁帶單元IBM 726問世,磁帶由像之前電影播放的大機櫃到後面的小盒子

磁帶類型

磁帶根據讀寫磁帶的工做原理,能夠分紅六種規格

  • 其中兩種採用螺旋掃描讀寫工做
  • 另外四種則是選用數據流存儲技術設計的設備

螺旋掃描讀寫方式

  • 面向工做組級的DAT(4mm)磁帶機
  • 面向部門級的8mm磁帶機

數據流春初技術設計的設備

  • 單磁頭讀寫方式
  • 磁帶寬度爲1/4英寸
  • 面向低端應用的Travan和DC系列
  • DLT和IBM的3480/3490/3590系列

磁帶技術介紹

  • 硬件
    • 單軸
    • 雙軸
  • 記錄方式
    • 螺旋
    • 線性
  • 磁帶寬度
    • 4毫米
    • 8毫米
    • 1/4英寸
    • 1/2英寸

線性掃描記錄

磁頭和磁帶之間會有接觸(摩擦),會磨損對壽命會減小,也會被幹擾灰塵

  • 容量大

螺旋掃描記錄

磁頭傾斜着讀取,相比於線性掃描記錄好

  • 定位塊
  • 壽命長

各類技術之間是不兼容的!!!

LTO技術

LTO(linear tape open)線性磁帶開放協議,雖然是一直標準格式沒的說並不互相兼容

由IBM、惠普與希捷聯合創建,在磁帶技術裏速度最快、容量最大的磁帶格式

  • IBM LTO/Ultrium-1
    • 平均文件訪問時間70s
  • IBM LTO/Ultrium-2
    • 平均文件訪問時間46s
  • IBM LTO/Ultrium-3
    • 平均文件訪問時間23s

image-20200310112641593

DLT/SDLT

容量中等速度慢

  • SDLT-320
  • SDLT-640

image-20200310112641593

AIT

容量小速度快

  • AIT-2
  • AIT-3

image-20200310112641593

綜合比較

image-20200310112641593

備份介質比較

image-20200310112641593

磁帶機品牌

IT廠商

HP、IBM、Exabyte

存儲廠商

Storage Tek、.....

磁帶的保存

前期採購投入低,自己便宜可是後期維護成本高,存儲協議之間兼容性差,磁盤存儲不安全可被篡改,易丟失

  • 總體保存時間爲十年
  • 溫度(保存場地須要對溫度進行控制)
    • 太高會數據丟失
    • 太低會磁帶損失
  • 溼度(保存場地須要對溼度進行控制)
    • 溼度太高會致使磁帶發黴
  • 按期倒帶致使老化
    • 若是不按期倒帶會致使壽命下降老化
  • 磁帶讀寫壽命短
    • 通常磁帶的讀寫次數不超過2000次

磁帶庫

基本組成

  • 庫體和機械臂
    • 自動化介質管理的基礎
    • 機槭臂的性能和可靠性在特定環境中要求較髙
  • 磁帶機驅動器
    • 類型:決定了數據昋吐能力、存儲容量、數據査詢速度,以及可靠性等基礎指標
    • 數量:決定了整個磁帶庫的總數據吞吐和處理能力
  • 磁帶戒指存儲槽位
  • 其餘附屬部件

磁帶庫構成示意圖

驅動器

二維機械臂

自由旋起色械臂

企業級自帶庫機械臂運動方式

磁帶倉

磁帶標籤

  • 惟一的

驅動器的清洗

  • 自動清洗
  • 主機清洗
  • 手動清洗

磁帶的保存

  • 總體保存時間爲十年
  • 溫度
  • 溼度

數據備份

  • 以SAN爲中心的告訴、大容量數據備份
  • 傳統的基於LAN的數據備份
  • 進行數據級的災難恢復:方式不可抗力致使的數據丟失

磁帶庫的應用領域

基本上只有歸檔存儲的時候纔會使用磁帶庫

  • 海量數據的歸檔

爲何要使用磁帶庫

  • 自動化管理大量磁帶
  • 自動化管理大量數據
  • 消除人工誤操做
  • 提升數據保護和存儲管理的效率

磁帶庫廠商

image-20200317084957710

VTL技術介紹

概念

虛擬磁帶庫 virtual Tape Library VTL,由磁盤構成,性能雖然好可是因爲磁盤因此前期價格比較貴

  • 經過固化了專門軟件的控制器,使磁盤(陣列)對主機或應用軟件體現爲常規物理磁帶庫,也稱做虛擬磁帶庫。
  • 標準的SCSI、FC或ISCSI主機接口,採用易用的管理軟件配置、管理虛擬磁帶庫設備

虛擬磁帶庫架構

虛擬磁帶庫實現方式

  • 純軟件方式VTL

    總體性能通常、實現成本較低

  • 專用服務器級VTL

    • 新能比純軟件快、價格也比純軟件貴,數據受主機的影響小,不足是系統優化性較低
  • 專用控制級VTL

    • 性能比專用服務器級快

虛擬磁帶庫特色

去掉了機械手臂、磁帶驅動器,傳輸速率高,但總體規模較大,不方便攜帶

  • 虛擬磁帶庫
  • 虛擬驅動器
  • 機械臂
  • 虛擬磁帶
  • 數據傳輸
  • 數據增值服務
  • 對備份應用的影響

細分

  • 磁帶庫系統

    不一樣虛擬磁帶庫架構之間是兼容的

    • 同一個物理的虛擬磁帶庫設備,可同時虛擬成多個磁帶庫系統;有些設備可提供8個甚至更多
    • 可同時提供數據備份
  • 虛擬驅動器

    • 全面支持現有物理驅動器類型
    • 支持設備數量
      • 理論上沒有數據限制
    • 通用標準接口
  • 機械臂

  • 磁帶

    • 全面支持現有物理磁帶類型
    • 可自定義的數據容量格式
    • 與真實磁帶的全面兼容、可進行真實磁帶和虛擬磁帶間的數據備份
  • 數據傳輸

    • image-20200317090550373
  • 虛擬磁帶

    • 數據壓縮
    • 重複數據刪除
    • 數據生命週期管理
    • 數據加密
    • 數據訪問權限管理
  • 對數據備份應用的影響

    • 備份模式的轉變
      D-D、D-D-T、D-VTL
    • 數據備份與數據歸檔的漸行漸遠,已逐漸不使用
    • 對備份窗口的策略
      • 增量備份、差別備份逐漸轉變爲全備份

磁盤/磁帶價格走勢

逐年降低,磁盤接近磁帶的價格

磁盤/磁帶的應用規劃

磁盤替代了許多磁帶的應用領域

備份/歸檔存儲方式規劃

存儲呈階梯式存儲簡單說你能夠將新能好價格高的硬件保留使用頻繁的數據,將性能通常價格適中或性能低價格低的存儲設備存放不常用的數據

  • 存儲方式不一樣

    • 備份
      • 在線備份
      • 近線備份
      • 離線備份
      • 離線存檔
    • 歸檔

    image-20200317091357770

  • 設備/介質選擇不一樣

磁盤庫優缺點

  • 優勢
    • 超大容量,可實現PB級別數據存儲,單位容量價格低
    • 可移動介質,便於離線和異地保存,磁帶能夠直接移動
    • 普遍的備份管理軟件支持,備份策略均針對磁帶庫結構定製和優化
  • 缺點
    • 維護負擔高
      • 磁帶庫的核心部件磁帶驅動器爲非封閉機械易損件,自己故障率高,灰塵、潮溼等使故障率不可預期,致使設備可用性差
    • 備份容易出錯
      • 採用磁帶庫進行數據保護的介質磁帶爲非封閉介質,且磁帶庫中的磁帶之間沒有容錯保護。備份業務涉及到的磁帶組中任一盤磨損、卡帶、黴點、粘連等,均會致使整個備份沒法恢復
    • 備份恢復能力不佳
      • 雖然磁帶自己的讀寫速度已有長足提升,但備份恢復時須要抓帶、加載、機械定位文件等機械動做,等待時間長,而備份恢復時通常會設計多帶查找,應用端被迫所以延長,而備份恢復時通常會設計多帶查找應用端被迫所以延長待機時間

磁盤備份的優缺點

  • 磁盤備份(D2D)的優勢:
    • 與磁帶不一樣,基於ATA的磁盤陣列比傳統的光纖通道磁盤陣列的成本低不少,同時逐漸變得很是流行,它能夠方便集成到備份系統中
    • 能夠解決磁帶庫固有的問題
  • 磁盤備份(D2D)的缺點:
    • 以一個文件目錄做爲一個備份設備且只對應一個備份卷
    • 備份數據經過文件系統寫入磁盤目錄
    • 文件系統寫速度慢
    • 文件系統容易遭到人爲破壞
    • 備份策略須要從新制定

虛擬磁帶庫的優缺點

可成爲在線應用與備份歸檔,能夠處理數據量大要求速度快的場景

  • 優勢
    • 方便集成、兼容性好,去掉了幾乎全部磁帶庫的缺點
    • 設備可用性提高:虛擬磁帶用電子化的機械手和磁帶驅動器,代替了機械磁帶庫中裸、易損的系列機械裝置,基於RAID保護的磁盤陣列具有降級工做能力,且具自動報警和在線熱恢復能力
    • 備份可靠性提高:虛擬磁帶庫採用基於RAID保護的磁盤陣列,從而將備份的可靠性較常規磁帶備份提升了若干量級。封閉式結構的磁盤介質自己的MTBF(平均無端障間隔)通常爲開放式結構的磁帶介質的5倍以上。
    • 恢復工做極爲漸變:若是所需數據存在VTL當中則不會設計任何機械工做,恢復工做就像磁盤備份的速度同樣
  • 缺點
    • 備份介質不能直接移動,存儲容量有限
    • 價格高

常見的幾種設備與存儲方式

硬盤

什麼是硬盤

硬盤HD

工做方式

  • 磁電轉換,硬盤存儲數據是根據電、磁轉換的原理來實現的
  • 硬盤驅動器加電後,磁盤片由主軸電機驅動進行高速旋轉,設置在盤片表面的磁頭則在電路控制下徑向移動到指定位置而後將數據存儲或讀出來。

硬盤發展簡史

早期硬盤很是大因此沒有使用,1968年沿用至今,硬盤也叫溫盤

2000年3月,IBM推出「玻璃」硬盤,玻璃-爲了下降成本經過將植物纖維提取製做而成,因爲植物沒有金屬磁電能力好,因此後期虧本將其硬盤部門賣出給日本

2007年,硬盤進入TB時代,國內2015年纔開始21

image-20200317102448921

早期的硬盤

早期硬盤很是重也很是昂貴,因爲當時很是貴,因此IBM用出租的方式盈利,早期DOS系統也很小,因此使用軟盤就能夠代替,此時硬盤爲M級別

image-20200317102644645

G級別的硬盤,最後那臺機器爲第一臺自帶硬盤的主機

image-20200317102752668

小知識

  • 爲何如今硬盤是c盤?由於,a盤留給了:軟盤,b盤留給了:磁盤

  • 磁盤(溫盤)裏面會保持氣密性,會將裏面的空氣淨化,磁頭在讀寫中會與磁盤盤片精密接觸,頭髮絲的距離,7200/60轉一秒鐘轉120次,如有塵埃灰塵就會產生上下振動,若向下則會物理撞擊,則會產生小坑,每過一次小坑則會產生振動致使產生更多的小肯

  • 筆記本的硬盤較爲特殊,會有移動監測區域,若超過閾值則命令硬盤中止工做移動至停泊區避免損壞硬盤

  • 不到萬不得已,若要開盤更換損害部件則要在超淨臺操做,開盤價格約在1500,超淨臺價格在幾萬到幾十萬不等

硬盤的結構

硬盤主要由:盤片,磁頭,盤片轉軸及控制電機,磁頭控制器,數據轉換器,接口,緩存等幾個部分組成。

硬盤尺寸主要有5.25英寸和3.5英寸,如今廣泛是3.5

筆記本的有2.五、1.8和0.9

硬盤的主要部件

拆解硬盤須要有內六角的起子打開,硬盤一旦拆開就要報廢,左上角的爲控制電路板,現在已經縮減爲一半大小,中間的爲盤片,盤片中間爲液態軸承馬達

image-20200317102937973

硬盤的外部結構

外面都會有標籤,都會標有編號、產地等信息

5VDC,5V五伏,DC直流電壓

image-20200317103159204

硬盤背面

綠色的爲控制電路板,圓形是液態軸承馬達

image-20200317103740901

接口

固定面板

硬盤是總體密封的,與外界隔絕,內部防水防塵,

裏面有個透氣孔是爲了防止熱脹冷縮因此放了個透氣孔保持內外氣壓平衡,透氣孔是有過濾膜可防水的

image-20200317103921518

控制電路板

其內部控制電路板能夠說是一臺完整的電腦,有CPU(中間最大的方框)有內存(左邊長條的)

image-20200317104034206

硬盤的內部結構

中間的液態軸承馬達帶動盤片旋轉,讀寫磁頭的磁頭很是的小,支架裏的馬達帶動傳動手臂左右移動讀寫

image-20200317104357652

image-20200317104407008

機械硬盤的磁頭技術

浮動磁頭組件

磁頭加點後高速旋轉,與盤片接觸間隙只有0.1~0.3μm

下面有4個磁頭,磁頭要動是一塊兒動的

image-20200317105354594

磁頭技術

image-20200317105545967

硬盤的接口

IDE、scsl、 Serial ata、UsB、 Fibre channel、EEE1394
最多見的就是|DE和Sera|ATA

  • IDE
  • SCSI
    • 經常使用於服務器
    • 優勢
      • 性能好
    • 缺點
      • 價格昂貴
  • SATA
    • 接口是L型的防呆設計可防止差錯
    • 通常可電腦掛載2個大一點可掛載4個
    • image-20200317105852764
    • 特色
      • 針腳小,解決了干擾問題
  • SAS
    • 串口鏈接
      • 傳輸速率高針對高性能企業
      • 可靠性高
  • FC
    • 光纖接口

硬盤的性能指標

  • 轉速
    • 7200RPM和5200RPM,高速10000RPM甚至15000RPM
      同一款硬盤其中一個比較便宜可能就是轉速比較低
  • 單碟容量
    • 單碟容量越高傳輸速率越高
  • 高速緩存
  • 最大內部數據傳輸速率
    • 從磁頭到硬盤的速度
  • 外部數據傳輸儲率
  • 尋道時間
    • 磁頭從停泊區移動到正確數據磁道上的時間
  • 潛伏期
  • 全程訪問時間
    • 將前面全部的時間加起來
  • 連續無端障時間(MTBF)
    • MTBF至少30,000小時以上(3年以上)
    • 保修期低於1年強烈建議不要買

磁盤使用的基數

  • 新型磁頭技術
  • SMART技術
    • 相似上一次忽然斷電則開機提示自檢
  • SPS防震技術

硬盤工做模式

  • LBA(主流)

其餘類型硬盤

  • 移動硬盤
    • 僞移動硬盤:有的商家利用筆記本硬盤+USB轉換接口套殼賣出,價格爲正常移動硬盤的一半,且防禦性很是低,且接口可能會有多個
  • 閃存
    • 閃存卡
    • image-20200317111249553
    • 記憶棒與早期MP3內存在的閃存
  • U盤

常見硬盤介紹

外觀都差很少

  • IBM(現爲日立)-現爲筆記本硬盤
  • 邁拓
  • 希捷 - 多爲臺式機機械硬盤
  • 部數據 - 多爲臺式機機械硬盤
  • 三星

硬盤的指標





  • 轉速
  • 無端障連續時間MTBF

硬盤 - 數據恢復的基本知識

硬盤的結構

sector - 扇區

溫盤結構特色以下:

  • 磁頭、盤片及運動機構密封在盤體內。
  • 磁頭在啓動、中止時與盤片接觸,在工做時因盤片高速旋轉,帶動磁頭「懸浮」在盤片上面呈飛行狀態(空氣動力學原理)
  • 磁頭工做時與盤片不直接接觸。
  • 磁盤表面很是平整光滑,能夠作鏡面使用。

硬盤邏輯結構

image-20200421085922302

image-20200421085945176

磁頭編號從0開始

盤片

  • 盤片通常用鋁合金作基片,也有用玻璃作基片的。每一個盤片都有兩個盤面(上、下),均可以裝上磁頭存儲數據,造成有效盤面。有效的盤面都有一個盤面號,從0開始;在硬盤系統中,盤面號又叫磁頭號;
  • 通常硬盤有2-3個盤片,因此磁頭號爲0-3或者0-5

磁道

編號從0開始

  • 磁盤在格式化時被劃分紅許多同心圓,這些同心圓軌跡叫作磁道( track).磁道從外冋內從0開始順序編號。一個盤面有300-1024個磁道,大容量的磁盤盤面磁道更多。
  • 從外面開始一圈一圈往裏面走

柱面

爲什麼每一個文件管理中每一個盤有的時候不是整數,而是少了那麼一點,由於磁盤是以柱面爲單位,分區的時候是將柱面劃分給指定的分區,假如在哪一個分區內恰好有個柱面小於通常,則默認忽略不算,因此就會出現59.9之類的狀況

  • 全部盤面上的同一個磁道構成一個圓柱,稱爲柱面( cylinder).柱面上的磁頭,從上而下從0開始編號。
  • 數據的讀寫是按柱面進行的,即磁頭首先在同個柱面內從0磁頭開始讀寫操做,依次向下(一、2.…….)在同一個柱面的磁頭上操做

扇區

編號從1開始

  • 做爲同心圓的磁道不是連續記錄數據的,被劃分紅一段段的圓弧,這些圓弧叫作扇區(sector),從1開始編號。
  • 操做系統以扇區形式存儲信息。每一個扇區爲512字節(byte),分爲兩個部分:存儲標識符和數據
  • 交叉因子
    • 若一個扇區,寫着123456789扇區,此時磁頭在扇區1的起始位置,當磁頭讀取扇區1的數據,因爲磁頭讀取時須要時間致使磁頭可能沒有讀取完數據1就已經」飛行「到了扇區2中間上了,因而就須要從新轉一圈後才能到達2的起始位置,因此就出現交叉因子
    • 交叉因子的扇區,就是交換了扇區編號,例如172839456,讀取了1後再轉多一點到達2的起始位置就不會出現上面那張狀況

容量

1KB是2個扇區,1個扇區是0.5KB

  • 硬盤的容量由盤面數(磁頭數)、柱面數、扇區數決定,計算公式爲:

  • 劃分 容量=盤面數*柱面數*扇區數*512字節

    1KB=2^10B=1024Byte
    1MB=2^10KB=2^20B=1048576Byte
    1GB=2^10MB=2^20KB=2^30B=1073741824Byte

磁盤容量大小計算

實際上就是獲得十六進制後換算成十進制後*512/1024/1024/1024

在winhex中使用讀取硬盤的十六進制數來計算硬盤容量的大小

image-20200421102754697

能夠看到十六進制值爲8020210007FEFFFF0008000000F07F07

  • 前八位:起始的自舉標誌爲80說明安裝了操做系統,202100爲CHS的起始地址,07爲NTFS格式,FEFFFF爲結束地址
  • 後八位:winhex中的數據計算都須要反過來讀
    • 00080000分區的起始地址 -- 00 00 08 00
    • 00F07F07爲分區的大小 -- 07 7F 0F 00
      • 分區大小的計算,將十六進制爲125767424*512/1024/1024/1024=59,結果倒是爲59GB

硬盤尋址

硬盤尋址模式

  • C/H/S(磁頭+柱面數+扇區數)
  • LBA(扇區邏輯塊地址)
  • C/H/S和LBA能夠相互轉換

image-20200421092756132

硬盤缺陷介紹

  • 缺陷扇區
    • 扇區若永久損壞則永久上不可修復,軟件上也只是邏輯上標記出指定扇區爲壞扇區而已,實際上不可修復
  • 磁道伺服缺陷
    • 全部數據都是從0磁道開始讀寫,0磁道上放置的是系統引導信息,若0磁道損壞了則須要將其修復,將硬盤的起始位置挪一挪避開0磁道
    • windows磁道工具只能從默認0磁道開始
  • 磁頭組件缺陷
    • 更換電路板
  • 系統信息錯亂
    • 重裝系統
  • 電子線路缺陷
  • 綜合新能缺陷

硬盤分區

分區目前有兩種方式

  • MBR
    • 傳統的使用方式,最大支持硬盤容量有限,最大支持爲2TB,最多有4個主要分區,能夠吧一個主分區變成擴展分區,擴展分區擁有無數個邏輯分區
  • GPT

MBR

  • 在MBR上分區和啓動信息都是保存在一塊兒的,若是這部分數據被覆蓋或者破壞就麻煩了

  • 硬盤須要通過低格、分區、高級格式化後才能使用

  • 低格

    • 做用:測試硬盤介質、爲硬盤劃分磁道、指定交叉因子,安排扇區、寫入扇區i,完成扇區設置、對磁盤表面測試,標記損壞磁道和扇區
    • 完成邏輯劃分工做,檢測每一個邏輯扇區好壞,低格以後數據就所有丟失了
    • 廠商出廠或者使用純DAO系統的format功能
  • 分區

    便於硬盤的規劃和文件的管理、有效的利用空間、提升系統效率、創建MBR

    • 分區粒度--分區最小單位是柱面
    • 每一個盤都會記錄其分區信息
    • 將硬盤劃分爲一個個邏輯區域。每一個分區有肯定的起、止位置
    • 分區的信息記錄在一個特殊位置的扇區,稱爲硬盤主引導記錄( Master boot recorder,MBR)或主引導扇區
    • MBR位於0磁頭,0磁道,1扇區
  • MBR區

    • MBR,即主引導記錄區,位於整個硬盤的0磁道0柱面1扇區。在總共512字節的主引導扇區中,MBR的引導程序佔用其中的前446個字節(偏移0~偏移1BDH),隨後的64個字節(偏移舊EH一偏移|FDH爲 DPT(Disk PartitionTable,硬盤分區表),最後的兩個字節「55AA"(偏移EH一偏移1FFH)是分區有效結束標誌。由它們共同構成硬盤主引導記錄,也稱主引導扇區。
    • 其中第1-446個字節是用來調用操做系統的機器碼的
    • 第447-510個字節是分區表的位置
    • 第511-512個字節是主引導記錄簽名,也就是0x55和0xAA,經過這種結尾方式判斷從哪一個應道設備進行應道
    • MBR通常佔用63個扇區(實際只佔用1個扇區)
    • image-20200421094822049

MBR的主引導:分區表

主引導記錄必需要知道我將控制權給誰,分區表的長度只有64個字節,裏面分紅4個項,每一個項佔16個字節,因此一個硬盤最多隻能分四個以及的分區,這四個又叫主分區,在第1三、1四、1五、16個Byte是主分區的扇區總數,這決定了主分區的容量,其中計算能夠查看下面的磁盤查看,雖然能夠使用擴展分區,可是仍是推薦單碟機械硬盤超過2TB都推薦用GPT而不是MBR

MBR構成

  • 一個扇區的硬盤主引導記錄MBR由的4個部分組成
    • 主引導程序
    • 出錯信息數據區
    • 分區表
    • 結束標誌字
  • 分區表含義
    image-20200421102235680
    前八位自舉標誌,要麼00要麼80,後八位爲本分區以前已用扇區數,最後四位爲整個分區的大小
  • 分區類型
    • image-20200421102235680

磁盤查看

image-20200421102754697

能夠看到十六進制值爲8020210007FEFFFF0008000000F07F07

  • 前八位:起始的自舉標誌爲80說明安裝了操做系統,202100爲CHS的起始地址,07爲NTFS格式,FEFFFF爲結束地址

  • 後八位:winhex中的數據計算都須要反過來讀

    • 00080000分區的起始地址 -- 00 00 08 00
    • 00F07F07爲分區的大小 -- 07 7F 0F 00
      • 分區大小的計算,將十六進制爲125767424*512/1024/1024/1024=59,結果倒是爲59GB
  • 假如在MBR系統中有這一串

  • 00 01 01 00 07 FE FF FF 3F 00 00 00 9A E5 3F 01
    前八位:
    00 - 起始的自舉標誌,80說明安裝了操做系統,00表示沒有
    01 01 00 - CHS的其實位置
    07 - NTFS格式
    FE FF FF 3F - 結束地址
    後八位:
    3F 00 00 00 --- 00 00 00 3f
    9A E5 3F 01 --- 01 3f e5 9a

虛擬分區技術

能夠從winhex的十六進制中能夠看出此表上只能分4個分區,多餘4個分區的時候就須要採用虛擬分區表

  • 主引導記錄最多記錄4個分區,多於4個分區的時候,採用虛擬分區表的辦法
  • 即主分區在記錄分區時,將多餘容量記錄爲擴展分區
  • 像是鏈式那樣,一環接一環,要讀取E盤就要先讀取C和D盤,每一個盤內都有一個MBR分區表,這樣能夠擴展出更多的硬盤,但缺點是假如D盤的MBR分區表出了問題,EF盤都不能讀取!

image-20200421105735527

GPT

全局惟一標識分區表,GPT是一種基於計算機中可擴展固件接口(EFI)使用的磁盤分區架構,他與UEFI相輔相成,UEFI是用來替代BIOS的

GUID分區表

這是一個隨機生成的字符串,在MBR上分區和啓動信息都是保存在一塊兒的,若是這部分數據被覆蓋或者破壞就麻煩了,相對的GPT在整個磁盤上保存了多個這部分信息的副本,他能夠恢復被破壞的這部分信息,GPT還未這些信息保存了循環冗餘校驗碼(CRC)以保證其完整和正確——若是數據被破壞GPT會發覺並從磁盤上的其餘地方進行修復

什麼是 GUID?

全球惟一標識符 (GUID) 是一個字母數字標識符,用於指示產品的惟一性安裝。在許多流行軟件應用程序(例如 Web 瀏覽器和媒體播放器)中,都使用 GUID。

GUID 的格式爲「xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx」,其中每一個 x 是 0-9 或 a-f 範圍內的一個十六進制的數字。例如:6F9619FF-8B86-D011-B42D-00C04FC964FF 即爲有效的 GUID 值。

爲何要用GUID

世界上的任何兩臺計算機都不會生成重複的 GUID 值。GUID 主要用於在擁有多個節點、多臺計算機的網絡或系統中,分配必須具備惟一性的標識符。在 Windows 平臺上,GUID 應用很是普遍:註冊表、類及接口標識、數據庫、甚至自動生成的機器名、目錄名等。

GPT分區表結構

當頭部丟失的時候能夠在尾部讀取鏡像恢復

  • 保護MBR
    • 保護MBR與正常的MBR區別不大,主要是分區表上的不一樣,在保護MBR中只要一個表示爲0xEE的分區,一次來表示這塊硬盤使用GPT分區表
  • 首要GPT頭
    • image-20200421231051355
  • 首要GPT
  • 磁盤數據區
  • 備用GPT
  • 備用GPT頭

image-20200421110937813

LBA0

LBA1

分區表頭,最多能夠建立128個分區

總結

在裝電腦中最好使用UEFI+GPT格式,更安全,支持的容量更大

存儲主要技術架構

DAS直連存儲

DAS須要獲得服務器的許可才能操做

存儲設備直接加在到主機上

  • 在一個DAS模式中何一個存儲設備是被直接鏈接到服務器上。服務器是訪問鏈接其白身存儲資源的惟一單點。
  • 服務器鏈接到一個圖地網終(LAN),個服務器就變成了在客戶端工做站和存儲資源之間的一個網關

直連存儲架構

  • 內置DAS
  • 外置DAS

SCSI昂貴配置複雜不容易擴展,總線支持很是短
絕大多數直連存儲環境使用小型計算機接口(SCSI)技術,

直接存儲的優點與劣勢

優點

  • 相對廉價
  • 使用熟練
  • 普遍應用,使用簡單

劣勢

  • 擴展性差
    • 受硬件卡槽影響,普通卡槽只有4 個,服務器可能有8個
  • 性能差
  • 與LAN和應用互相影響
  • 不能輕易和經濟性的擴展
  • 受鏈接距離限制
    • 由於鏈接線比較短因此物理主機在哪直接存儲設備就必須在哪
  • 包括不少單點故障
    • 當物理主機出了故障會致使存儲設備帶來直接影響
  • 管理困難
    • 不能批量操做,只能登錄到指定的每一臺物理設備上配置

DAS的應用場景

DAS環境受制約

  • 只有1臺服務器能夠直接鏈接一個指定的存儲資源
  • 存儲資源訪問必須與服務器中的其餘應用共同競爭服務器的CPU、內存和ⅣO總線資源。這就下降了存儲系統的性能
  • 訪問服務器的存儲資源一樣受可用的局域網(LAN)帶寬的限制。局域網上的訪問流量能夠影響對存儲訪問的時間和速度,存儲訪問也能夠影響使用局域網的其餘應用的性能
  • 每一臺服務器能夠支持數量很是有限的存儲設備。當達到極限時,爲了增長存儲容量就須要添加額外的服務器。因此,DAS不可以很輕易和經濟地擴展

DAS應用

  • RAID(磁盤陣列)
  • JBOD/SPAN(磁盤簇)

NAS

網絡鏈接存儲(NAS)概述

NAS(Network Attached Storage)

網絡鏈接存儲、或稱附屬存儲

  • NAS設備基本上是指那些專門提供存儲資源的專用服務器,他提供即插即用的存儲擴展資源
  • NAS設誒能夠直接介入LAN,客戶端和服務器經過LAN訪問NAS上的存儲資源
  • NAS設備典型的使用一個獨立的文件系統平臺來存儲數據

NAS架構

image-20200324090849113

NAS特色

  • 與系統無關
    • 支持多種文件及數據共享方式
    • 支持windows、linux、unix等操做系統
    • 支持不一樣系統間對同一份數據的共享
      • 因爲有本身的操做系統,因此能夠存儲爲本身獨立的格式,若win來則讀取轉換成win的格式,linux來則讀取轉換成linux的格式
  • 簡便的安裝與管理
    • 出廠預裝OS及相關軟件,並進行軟硬件預設值
    • 支持基於Web的GUI遠程管理
  • 強大的系統備份與恢復功能
  • 優化的系統
  • 方便的容量擴充
  • 總體擁有成本TCO低
    • 前期採購成本高,管理成本低

NAS的優點與劣勢

優點

  • 訪問快
  • 可擴展性能好
  • 使用靈活
  • 性能可靠
  • 易於安裝和管理
  • 成本低、廉價

劣勢

  • 自己性能是瓶頸
    • 因爲NAS設備原本是專用的一臺優化後的文件服務器,因此NAS服務器自己就是一個瓶頸
  • 一個NAS設別性能也受可用網絡(LAN)寬帶的限制
    • 文件傳輸與應用服務所使用的寬帶容易受影響會出現資源爭奪現象
  • 不支持數據庫
    • 不適合塊級數據應用的傳輸——不支持數據庫

使用場景

局域網內文件級的共享訪問,因爲能夠遠程操做能夠進行遠程備份

NAS與DAS

  • NAS對文件和應用的訪問快於DAS,沒有資源競爭的狀況,
  • 多服務器能夠訪問同一個NAS設備,增長了應用的可擴展性
  • 由於服務器和客戶端都在LAN上訪問,提升了靈活的、分佈式的存儲環境,提升了安全可靠
  • NAS比DAS更可靠
  • NAS即插即用
  • 由於NAS設備使用一個獨立平臺文件系統,任何鏈接到網絡的主機操做系統均可以訪問到NAS存儲資源

SAN 存儲區域網

SAN(Storage Area Network)

  • 存儲區域網絡、或稱第二網絡、後端網

  • 將存儲設備獨立分開,變成了網絡當中的一個節點,故障不會互相影響,管理簡單

  • 將存儲網絡獨立分開成一個存儲業務網絡,不會影響使用者自己上網的網絡

  • 性能上優於DAS與NAS經常使用於高端環境,可是因爲設備的增長因此價格會有所增長

  • 廣義SAN

    • 支持多種協議的SAN
  • 狹義SAN

    • FC-SAN(用光纖做爲鏈接SAN,因此不支持TCP/IP協議)

image-20200324092517735

概述

  • 存儲區域網絡是一個由專用網絡鏈接起來的由服務器和獨立存儲設備組成的
  • 不像NAS設備,存儲區域網絡存儲設備不包含任何服務器功能,而且它們不是運行一個文件系統。
  • 主機負責運行和管理文件系統。在這個環境中,任何一臺服務器能夠訪問任何一個存儲設備。
  • 臺服務器能夠訪問多個存儲設備,而且多個服務器能夠訪問同一個存儲設備
  • 這容許服務器和存儲設備各自獨立地擴充。

光纖通道存儲區域網架構

主機-交換設備-存儲設備(其中交換介質都是用光纖鏈接起來)

光纖通道協議傳輸速度上快於SCSI

SAN的組成

  • server(服務器)
  • storage(存儲設備)
    • 磁盤陣列、磁帶設備
  • SAN fabric(鏈接設備)
    • 集線器、交換機、路由器、網關、HBA卡
  • software (管理軟件)

SAN管理

初期的投入大

  • 資產管理
  • 容量管理
  • 配置管理
  • 性能管理
  • 可用性管理

SAN的優點與劣勢

優點

  • SAN提供高可擴展性
    • 服務器、存儲和帶寬能夠獨立的被擴展
  • 能夠運行數據庫

劣勢

  • 價格高(前期投入大)

  • 異構環境下的互操做性

  • 管理複雜

三種存儲 架構

image-20200324095300668

可擴展性和可用性

SAN>NAS>DAS

成本比較

運維成本

SAN>DAS>NAS

一次性採購成本

SAN>DAS與NAS

三種技術架構的比較

image-20200324095949797

SAN的主要應用

用於容災保護

存儲整合

客戶端用網絡與服務器相連,服務器經過光纖與交換機與存儲設備(存儲池)相連

提供了高性能

提供了數據安全的訪問

高性能數據備份

LAN Free備份

服務器啓到中轉功能,對服務器有必定影響

  1. 減小備份(恢復窗口)
  2. 優化磁帶應用(目前可能不適用)
  3. 下降服務器負擔
  4. 消除對業務網絡的影響
Server Less備份

服務器只起到發起功能,不在參與後續操做,能夠專心對前端持續工做

  1. 實現不影響應用的備份
  2. 消除服務器負擔

基於數據鏡像的高級容災數據保護

分佈式存儲

Fibre Channel(fc SAN)

FC SAN定義

一種徹底光纖的傳輸

  • 高速
  • 數據整合
  • 支持差錯檢測
  • 支持遠距離傳輸
  • 支持遠距離管理

傳統的SAN是基於光纖完成的

光纖通道協議

image-20200324110927007

image-20200324110955921

三種拓撲架構

  • 點對點
    • 2
  • 環型拓撲
    • 126
  • 星型鏈接(主流!)
    • 一千六百萬

image-20200324111031525

點對點拓撲結構

  • 點對點拓撲是指在一臺服務器和一個存儲設備之間專用鏈接
  • 點對點以光纖通道協議代替SCSI的基礎直連架構

仲裁環拓撲結構

光纖通道設備以環路形式鏈接
物理表現爲Hub上的星型鏈接
公有/私有仲裁環路協議
(Public/Private Arbitrated Loop)

環形拓撲結構特色

  • 共享帶寬
  • 每一個Loop最多支持126個節點和1個 FL Port
  • 使用LIP給每一個設備指定FCAL地址
  • 使用仲裁環路協議控制對介質的訪問
  • 私有 Private和公共 Public環
  • 若節點出現單點故障則會出現速率驟降

星型環路交換

  • 中心節點一旦出現問題整個網絡壞掉,解決辦法是接上冗餘設備

交換Fabric拓撲

  • 其中FC-SW最爲經常使用
  • any to any的全帶寬鏈接

特色

  • 設備獨享帶寬
  • 支持一千六百萬地址空間
  • 能夠直接鏈接節點或仲裁環路/集線器
  • 支持各類高級服務,用於發現和監控設備

HBA

  • 爲服務器或客戶機內部總線(PCI和SBUS等)提供與光纖網絡的接口
  • HBA軟件驅動爲操做系統提供所需存儲信息
    • 對I/O進行操做 I/O同時對正常請求進行控制
    • 銅/光介質支持(能夠是雙接口卡)

光電轉換器

小型串行到串行熱交換模塊,主要功能是提供相應介質接口(銅或光)

FC的優缺點

  • 信息孤島
    • SAN一旦造成就是一個單純的獨立網絡
  • SAN管理權的濫用
    • 因爲其是在SAN內部,因此SAN擁有最高權限能夠對其進行任意操做
  • 安全技術不易統一管理
    • 有各類技術與各類兼容性問題
  • 管理的複雜性

FC適應環境

  • 高數據傳輸帶寬要求
  • 高數據訪問io要求
  • 高數據安全級別
  • 遠距離數據傳輸
  • 塊數據傳輸
  • 數據備份
  • 災難恢復
  • 數據共亨

IP SAN(ISCSI)

因爲FC SAN成本比較高,因此後期改用以太網替換光纖鏈接雖然速度上沒有FC SAN快可是下降了成本

ISCSI定義

能夠理解ISCSI是IP與SCSI的融合

  • 在 Interne協議(|P)統治着局域網和廣域網。 Internet小型機系統接口(iSCSI)協議整合了存儲和IP網絡,使經過IP網絡完成存儲數據塊的傳輸成爲現實。它創建在兩個已被普遍應用的技術之上-爲存儲而創建的SCS命令和爲網絡化而創建的|P協議。
  • iSCSI是一種端到端的協議,用於在IP網絡中傳輸存I/O數據塊。該協議被使用於服務器( initiator)、存儲設備( target)和協議傳輸網關設備。
  • iSCS使用標準的以太網交換機和路由器,將數據從服務器轉移到存儲設備。它還使得IP和以太網基礎設施能夠被用於對SAN存儲系統的擴展訪問,跨過任意距離完成對SAN的擴展接入。

ISCSI協議

iSCS協議是將SCS的遠程過程調用(rpc)映射到IP協議的過程。isCS|協議提供了獨立於他所攜帶的SCSI CDB的層的概念。isCSI請求傳遞SCS命令,iSCSI響應處理SCSI響應和狀態。

image-20200324114333471

ISCSI設備

  • Taget目標器
    • iSCSI的存儲設備稱爲iSCSITarget
  • initiator啓動器
    • iSCSI容許使用通常 Ethernet NIC卡(網絡卡,爲了效率多半是GbE以上等級)與 Ethernet Switch(交換器),若使用通常GbE卡,則還須要搭配軟件才能讓GbE卡收發isCSI協議,此軟件稱爲iSCSI Initiator,事實上iSCS HBA的角色也等同於iSCSI Initiator.

ISCSI工做流程

在Target端和Initiator端將SCSI命令從新TCP/IP封包和解包後,便可在普通的以太網內傳輸

image-20200324115320094

ISCSI特性

  • 連通性
    • 使用IP全局地址表,iSCSI設備增長了兩個類型的表示:一個是iSCSI設備名,一個是iSCSI地址
  • 數據傳輸
    • 千兆、萬兆以太網接口
    • 千兆,1Gb單端口理論值1000Gb/s,即125MB/s
    • 萬兆,10GB,1.25GB/s

經常使用組件

  • 交換設備
    • 以太網交換機
    • iscsi智能交換設備
    • iscsi橋接器
  • ISCSI HBA卡
    • iSCSI HBA卡就是採用內建SCSI指令及TOE引發的ASIC芯片的適配卡

IP SAN拓撲結構

ISCSI優勢

  • 建置成本低廉
  • 管理門檻及維護成本更
  • 節省存儲資源、作好集中管理
  • 沒有距離的限制
  • 傳輸速度快
  • 系統兼容性好
  • 人才較多*

使用領域

  • 數據傳輸連續性
  • 遠距離數據傳輸
  • 塊數據傳輸
  • 數據備份
  • 災難恢復
  • 多主機數據訪問

SAN的廣域網技術

主要應用技術

  • FCIP、iFCP、iSCSI
  • DWDM、SONET、IP

DAS、NAS、SAN與ISCSI的性能特色比較

image-20200324112155970

其餘補充

FCIP

因爲FCSAN容易出現信息孤島因此出現了將光纖經過IP鏈接起來

  • 在 FC SAN孤島之間依賴基於IP的網絡服務提供局域網、城域網和廣域網的鏈接
  • 依賴於TCP的擁塞控制和網絡管理
  • 數據糾錯和丟失恢復依賴於TcP和FC雙重機制
  • FciP視全部的FC幀於數據報等同

image-20200324120603153

iFCP

一部分用FC SAN 一部分用IP SAN

  • 網關到網關的協議,用TCP/P交換和路由設備做爲 FC Fabric設備的補充或替代,來實現 FC SAN
  • 將已有的FC存儲產品鏈接到IP網絡的協議

image-20200324120712731

iSCSI

  • 運行在TCP層上的SCSI傳輸協議
  • 在IP網絡上封裝SCSI命令的新機制
  • 在新一代內置支持TCP/IP的存儲端節點設計的協議

image-20200324120825304

FCIP、iFCP、iSCSI拓撲區別

image-20200324112521255

廣域網技術

DWDM

虛擬化存儲

存儲虛擬化的目的

  • 抽象

  • 隱藏

  • 隔離

  • 提升設備使用效率

  • 統一數據管理功能

  • 設備構件化

  • 下降管理難度提升可擴展性

  • 數據庫跨設備流動

用虛擬化簡化IT架構

  1. 融合:技術基礎(更可靠、更可控、更靈活、更易擴展、更低成本)
  2. 開放:個性化基礎(SOA的標準中間件架構和應用開發接口)
  3. 面向應用:以應用爲先導,資源動態分配、統一管理

磁盤虛擬化

  1. 磁盤扇區的物理地址通常用CHS(柱面號-磁頭號-扇區號)表示
  2. 磁盤虛擬化就是將扇區地址用LBA(邏輯塊地址)表示,屏蔽底層物理磁盤的概念
  3. 磁盤虛擬由磁盤自身固件完成
  4. 磁盤虛擬化的結果是使磁盤的使用者無須瞭解磁盤的內部硬件細節,經過塊地址就能夠訪問磁盤

塊虛擬化

  1. 塊虛擬化是指對多塊硬盤創建RAID,劃分邏輯卷(LUN).
  2. 每一個邏輯卷對於使用者都徹底等同於一塊物理硬盤。物理上來講,這個邏輯卷的全部數據塊,都是經過RAD處理,分佈在不一樣的物理硬盤上。
  3. 塊虛擬化的結果是使存儲的使用者無須關心RAD實現的具體過程,只要象讀寫普通硬盤同樣讀寫這個邏輯卷,就能得到RAID對數據的保護功能。

NAS虛擬化

NAS的虛擬化不一樣大多在於系統

特色:

  • 支持異構主機
  • 成熟的網絡拓撲結構
  • 高度集成的存儲子系統
  • 設備簡單化

基於主機的存儲虛擬化

一般在中高端存儲設備

主要用途:使服務器的存儲空間能夠跨越多個異構的磁盤陣列,經常使用於在不一樣磁盤陣列之間作數據鏡像保護。
實現方式:通常由操做系統下的邏輯卷管理軟件完成(安裝客戶端軟件),不一樣操做系
統的邏輯卷管理軟件也不相同。

優勢

  • 支持異構的存儲系統。

缺點

  • 佔用主機資源,下降應用性能存在操做系統和應用的兼容性問題。
  • 致使主機升級、維護和擴展很是複雜,並且容易形成系統不穩定性。
  • 須要複雜的數據遷移過程,影響業務連續性

基於網絡的存儲虛擬化

主要用途:異構存儲系統整合和統一數據管理。
實現方式:經過在存儲域網(SAN)中添加虛擬化引擎實現。

優勢:

  • 與主機無關,不佔用主機資源。
  • 可以支持異構主機、異構存儲設備。
  • 使不一樣存儲設備的數據管理功能統
  • 構建統一管理平臺,可擴展性好。

缺點:

  • 部分廠商數據管理功能弱,難以達到虛擬化統一數據管理的目的。
  • 部分廠商產品成熟度較低,仍然存在和不一樣存儲和主機的兼容性問題。

存儲虛擬化實現技術比較

image-20200331091523806

「帶內」與「帶外」

  • 根據存儲虛擬化實現的機制,存儲虛擬化可分爲「帶內」和「帶外」兩種基本類型。

  • 帶內虛擬技術是在數據讀寫的過程當中,在主機到存儲設備的路徑上實現存儲虛擬化

  • 帶外虛擬技術,是在數據讀寫以前,就已經作好了虛擬工做,並且實現虛擬的部分並不在主機到存儲設備的訪問路徑上

  • 因此帶內虛擬技術能夠基於主機、設備和網絡實現而帶外虛擬技術則只能是基於存儲網絡實現。

  • 帶外實現難度比帶內難

  • 帶內是邏輯化存儲設備,可是擁有瓶頸,帶內幾乎是一個數據中轉器,就如同火車只有一個頭帶

  • 帶外在數據處理過程當中不會產生瓶頸,在異構存儲系統之間須要大規模整合(極其複雜),帶內幾乎是所有設備都是數據中轉器,就如同火車每一節都是火車頭在跑(均勻存儲、擁有冗餘、可靠性高、快速)

產品差別化

  • 基於網絡的帶內虛擬化產品,一方面全部虛擬化數據都要經過該產品進行處理,所以它很容易成爲路徑中的一個瓶頸,另外一方面若是用戶須要高可用性那麼須要額外増加設備數量。
  • 帶外虛擬化產品,在數據處理過程當中不會產生瓶頸在異構存儲糸統之間進行大規模整合,能夠充分提升對存儲資源的利用率

顯示結果

  • 帶內架構會在服務器與物理存儲設備或SAN之間部署一個控制器,全部的存儲請求和數據流都要通過這個控制器處理。而滯外模式的產品會在網絡層部署一個元數據控制器,將全部的存儲請求重定向到真實的物理位置,但其自己並不負責數據處理
  • 與帶內模式相比,帶外模式的處理流程更加複雜,但卻能夠減小CPU的負載。帶外的存儲虛擬化還能夠避免潛在的糸統崩潰風險,由於帶內模式下存儲是通過從新映射的,一旦帶內控制器失效,客戶端主機與後端存儲的鏈接也將丟失。
  • 今天,大多數基於網絡的存儲虛擬化解決方案採用的都是帶內模式(由於帶內簡單),其中主要的緣由多是如今CPU的處理能力更強,與過去相比不在是祭構的瓶頸。而帶內虛擬化架構普及的另外一個緣由則是帶內方案實現起來更容易,能夠更快的推向市場,問題也更少。

帶內虛擬化

用途:

  • 異構存儲系統整合
  • 統一數據管理,在業務運行同時完成複製、鏡像、CDP等各類數據管理功能

優勢

  • 服務器、存儲設備的兼容性好

  • 虛擬化和數據管理功能由專用硬件實現,不佔用主機資源

  • 豐富的數據管理功能

  • 配置簡單,易於實施

缺點:

  • 虛擬化設備發生故障,整個系統將中斷

帶外虛擬化

OpenStack:開源的雲計算管理平臺項目

用途:通常用於不一樣存儲設備之間的數據複製

優勢

  • 虛擬化設備發生故障,整個系統將不會中斷

缺點:

  • 主機資源佔用較大
  • 大部分產品缺少數據管理功能
  • 主機和存儲系統須要嚴格的兼容性認證
  • 數據初始化同步複雜
  • 配置複雜,實施難度高

計算雲與存儲雲

存儲雲技術架構

存儲雲建設的考慮因素

  • 高可用性
  • 數據安全

存儲虛擬化涉及的技術image-20200331095228472

虛擬化技術的整合方案

將上面所述技術再整合進行使用

虛擬化的必要性:下降管理成本、提升利用率
虛擬化的本質:將物理資源映射成虛擬資源統一管理
例子:雲盤...

存儲節能技術

  • MAID技術
  • 數據分級存儲
  • 自動精簡配置
  • 重複數據刪除技術

MAID技術

MAID技術在磁帶庫工做模式的基礎上提出和發畏起來的。磁帶庠的工做原理是正常狀態下全部的磁帶都放置在磁帶庠的槽位中,須要某盤磁帶肘纔將它放在磁帶機中,而後進行數據讀寫。而在大部分肘間,大多數磁帶是處在非工做狀態的。MAID應用了一樣的原理,只有須要肘纔將一部分磁盤開機運轉,而其餘磁盤一般處於斷電狀態,就像磁帶庠中的磁帶同樣。所以應用的MAID技術的磁盤存儲也能夠稱之爲磁盤庠。

MAID存儲的功能

  • MAID節點功能工做方式分三個階段,各個階段時間間隔能夠由用戶自行定義
  • 假設2分鐘內沒有讀取資料肘,硬盤磁頭就會自行停留到沒有存取數據的地方,以節省磁頭的功耗;過了10分鐘後若仍沒有讀取,就會進入第二階段,硬盤會下降轉速至4000rpm;若過了15分鐘後仍沒有談取資料,就會進入第三階段,硬盤因而會中止運轉,等到糸統呼叫肘再啓動,但因爲硬盤仍處於通電狀態,所以仍是在「準備狀態」,再啓動的肘間約爲10~15秒。

MAID存儲的特色

  • MAID存儲糸統中的磁盤或碩盤RAID組能夠在沒有讀寫訪問肘依據策略下電
  • 下電磁盤自動依策略進行故障檢查;
  • 碳盤在下電之後,一旦有讀寫請求,磁盤自動上電,RAID組可從新
  • 提供正常訪問
  • 下降能耗,電能節約可到達30%
  • 減小環境和管理成本;
  • 更長的磁盤使用壽命。

MAID存儲的應用環境

MAID存儲的工做原理是使長肘間無訪問請求的硬盤處於 Power oFF狀態,以達到綠色節能和延長硬盤壽命,所以MAD存儲適用於訪問頻率低、數據即肘可得性要求低的大容量近線存儲( Nearline Storage)設備和分級存儲,尤爲適用在以數據恢復爲目的的數據備份和數據歸檔等應用上。並不適用於高性能實肘訪問糸統,或訪問肘間間隔較小的應用糸統。

基於VTL+MAID的數據備份解決方案

存儲頻率不高

基於CDN+MAID的視頻網站存儲解決方案

視頻雖然數量大,可是通常分爲點擊率熱門和非熱門的數據

基於存儲策略+MAID的視頻監控存儲解決方案

視頻監控系統設計規範要求各監控點採集的視頻圖像必需在線保存10-15天,甚至是30天才能刪除

數據分級存儲

根據數據使用頻率和價值高低分放到不一樣的存儲介質中

其中數據遷移是一個較爲重要的過程

  • 數據遷移的規則,例如數據使用的頻率與數據價值

分級存儲優勢

  • 減小整體存儲成本

  • 性能優化:分級存儲可以使不一樣性價比的存儲設備發揮最大的綜合效益

  • 改善數據可用性:分級存儲把不多使用的歷史數據遷移到輔助存儲器中,或歸檔到離線存儲池中,這樣就無需反覆保存,減小了存儲的肘間,同肘提升了在線數據的可用性,使磁盤的可用空問維持在糸統要求的水平上。

  • 數據遷移對應用透明:進行分級存儲後,數據移動到另外的存儲器

    肘,應用程序不須要改變,使數據遷移對應用透明

自動精簡配置

  • 自動精簡配置是一種存儲管理的特性,核心原理是「欺騙」標做糸統,讓操做糸統認爲存儲設備中有很大的存儲空間,而實際上的物理存儲空間則沒有那麼大
  • 服務器識別存儲設備的肘候,看到的並非真實空間,而是由自動精簡配置虛擬出來的卷。並且只有當服務器寫入存儲的肘候,真實的空間纔會被分配。
  • 當使用量超過閥值的時候則會自動增長容量,其提升了存儲空間的利用效率、下降了成本投入

技術優點

  • 能夠自動擴畏已經分配的存儲卷。
  • 能夠使用戶使用接近100%的存儲空間。
  • 和遠程鏡像結合的肘候,能夠節省鏡像的空間和帶寬
  • 費用節省、空間利用率的提高
    • 一個驚呆了的自動精簡配置能大約減小20%的存儲費用

重複數據刪除

  • 將數據集(在備份環境下,一般是備份教據流)劃分爲教據抉並將這些數據寫入磁盤目標區城。爲了識別傳輸教據流中的數據抉,重複數據刪除引擎會爲每一個數據段建立一個數字簽名(相似指紋),併爲給定存儲庫的簽名建立一個索引。
  • 該索引可從所存儲數據段中重建,並提供了引用列表,以肯定數據塊是否已處於存儲庫中。
  • 在複製操做過程當中,該索引可用來肯定哪些數據段要被存儲,哪些教據段要被複制。當重複數據刪除軟件發現某一教據塊之前已被處理過,則會插入指向該數據集元數據中原始數據塊的指針,而不是再次存儲該數據塊。

重複數據刪除方法

  • 固定長度數據塊切割(定長)
    • 壓縮效率低,簡單,一塊變化所有變化
  • 可變長度數據段切割(非定長/可變定長)
    • 壓縮效率高,複雜,一塊變化其他不影響

基於備份源基於目標端的重複數據刪除

  • 基於源端:性能依靠源端,會影響源端自己業務,網絡過程當中傳輸數據量下降,整個備份網絡寬帶也就下降了
  • 基於目標端:目標端與源端隔離,源端可繼續處理原有業務,下降了網絡傳輸

從過程的角度分帶內和帶外

帶內的方法比帶外的效率高

不一樣條件下重複數據刪除效率

越低越好

相同率最高的是 Windows文件,能夠達到將近600:1的重複數據刪除比率。比較低的應該是數據庠文件、LinuⅨX文件,能夠達到75:1的重複數據刪除比率。若是是NAS文件,比較好的狀況下也能夠實現135:1的比率

image-20200331111121020

選擇重複數據刪除的原則

  • 基本上認爲大概正常的文件應用能夠達到50%以上的重複數據刪除。
  • 對於定長的重複數據刪除解決方案,切塊越小,刪除比率越高。
  • 採用變長算法的重複數據刪除解決方案,能夠大大提升咱們的重複數據刪除率但也增長了糸統的消耗。
  • 基於數據源的重複數據刪除解決方案廣泛比基於目標端的高,此外基於備份源的重複數據刪除方案還能有效地下降備份網絡的負擔,但增長的是糸統的計算誚耗須要有相應的硬件解決方案。

數據備份

  • 拷貝不等於備份
  • 磁盤陣列不等於備份
  • 集羣(Cluster)不等於備份
  • 備份的特色
    • 備份可保留檔案的歷史記錄
    • 備份可保存目錄服務記錄及重要的系統信息
  • 可以恢復的備份才叫備份

備份窗口

一個工做週期內留給備份系統進行備份的時間長度,若是備份窗口太小,則要努力提升備份速度

備份窗口/備份時間

  • 備份時間
    • 數據從開始備份到徹底結束所經歷的時間
  • 數據恢復時間
    • 即在出現災難的時候,咱們可以多快地恢復所有數據,從新開始
      正常的業務。

縮短備份時間

對外服務的時長是不可能壓縮的,因此通常是採用提升備份速度

  • 增量備份
  • 日誌備份
  • 使用快速備份設備
  • 提升網絡寬帶
  • 使用特殊備份功能

縮短恢復時間的方法

縮短恢復時間與縮短備份時間的備份策略是衝突的(不用花錢),硬件設備不衝突(要花錢)

  • 使用全備份
  • 不使用日誌備份
  • 使用快速備份設備
  • 提升網絡寬帶

備份的類型

從備份數據的內容上區分:

  • 徹底備份
  • 對備份對象進行一次徹底備份
  • 增量備份
    • 每次備份的數據只是相對於上一次備份後新增長的和修改過的數據
  • 差分備份
    • 每次備份的數據是相對於上一次全備份以後增長的和修改過的數據

image-20200407091712892

image-20200407092230435

若要退回到星期五的備份狀態:

  • 全備份只須要一個備份數據
  • 差別備份須要星期天的全備份和星期五的備份兩個備份數據
  • 增量備份須要星期天的全備份與星期一至五的增量備份,共六個備份數據

備份比較

  • 速度上來講:增量備份>差別備份>全備份
  • 可靠性來講:全備份>差別備份>增量備份
  • 恢復時間來講:全備份>差別備份>增量備份

備份的方式

  • 從使用的角度來看:
    • 手工備份一功能最強、成本最高、最易出錯
    • 自動備份一使用方便、成功率高、下降成本
  • 從應用的角度來看:
    • 離線備份一業務須要停頓
    • 在線備份一業務不停頓

本地備份

  • 什麼是本地備份?
    • 本地備份也叫手工備份,是每臺服務器有本身的本地備份設備,這是最簡單的備份方案。因爲備份設備鏈接到每臺服務器上,所了硬件投資,還增長了管理的費用。.這種備份方案不只增長以每臺服務器不得不單獨管理備份進程
  • 本地備份的問題
    • 手動,用戶每次都要本身配置備份任務
    • 無規律,沒有策略
    • 缺少對備份數據的管理

網絡備份

  • 網絡備份?
    • 網絡備份也叫作LAN備份,是一種流行的備份解決方案。一般,帶有備份設備的備份服務器被放置在網絡中。備份服務器負責整個系統的備份,它管理整個網絡的備份策略、備份媒體和備份目標。全部的備份數據必須經過本地局域網進行傳輸
  • 網絡備份的優勢
    • 實現了大容量自動化、集中式備份
    • 備份過程有策略管理,無需管理員介入
    • 網絡內全部須要備份的服務器可共享一臺備份設備

Server less備份

  • 什麼叫 Server less備份?
    • Server less備份是備份技術中最近的技術,它能夠在 LAN Free備份的基礎上節省有價值的服務器資源(CPU、內存等).一些Server less備份設備放在服務器和存儲子系統之間,這些設備負責備份數據的仝部責任,它從存儲陣列向磁帶設備直接發送數據。
  • Server less備份的優勢
    • 實現不影響應用的備份
    • 極大的減小服務器負擔

使用備份軟件

  • 能夠實現無人值守的計劃自動備份
  • 備份實現靈活,易於伸縮擴展
  • 能夠對媒體介質資源進行集中管理
  • 能夠對全部客戶的備份任務進行集中管理
  • 能夠實現對異構平臺的備份
  • 對許多應用(數據庫等)強大的支持功能
  • 能夠進行LAN-Free、 Server less等高級備份方式
  • 完備的日誌系統能夠使管理員根據不一樣需求進行監控和查詢

成功部署備份系統須要考慮的問題

您準備花多少時間恢復系統?
每次備份您最長給我多少時間?
備份的數據量有多大?
備份數據的類型是什麼?
恢復時您能讓我丟多少數據?
但願各類數據保留多長時間?
系統環境?主機/存儲/帶寬/應用
打算花多少錢?

影響備份系統的因素

  • 目標數據
  • 目標數據的容量
  • 備份時間
  • 恢復時間
  • 備份類型
  • 設備類型
  • 備份計劃
    • 全備份、差別備份、增量備份
  • 備份系統的結構的類型
  • 在線備份

網絡備份架構的組成

  • 硬件組成
    • 備份服務器(Backup Server):負責管理整個系統的備份過程
    • 備份客戶端(Backup Client):須要備份的應用服務器(Application Server)
    • 備份設備:能夠是磁盤陣列(Disk Array)、磁帶庫(Tape Library)或虛擬磁帶庫(VTL)
  • 軟件組成
    • 服務器端備份軟件:安裝在備份服務器中,負責控制、監控、制定全部的備份任務。
    • 客戶端備份軟件:安裝在須要備份的應用服務器中,負責與備份服務器通信,並將備份數據送出。
    • 數據庫代理軟件:安裝在須要備份的數據庫服務器中,負責數據備份的一致性與完整性。
    • 帶庫驅動模塊:安裝在備份服務器中,容許備份數據寫入備份設備中
  • 備份網絡
    • 般爲百兆或千兆以太網,備份服務器、備份客戶端都需鏈接到備份網絡,備份數據流及控制命令流都在該網絡上傳輸

備份及恢復流程

  • 備份流程
    • 在備份服務器中設置備份任務及策略
    • 備份服務器定時啓動備份任務,經過以太網發送控制命令通知備份客戶端開始備份。
    • 備份客戶端接收備份命令,啓動數據庫代理軟件保證數據庫的一致性,並開始發送備份數據經過以太網傳輸到備份服務器端
    • 備份服務器接收備份數據,並將備份數據寫入備份設備中。
  • 恢復流程
    • 業務系統數據丟失,須要恢復數據的客戶端中止業務應用。
    • 在備份服務器端啓動恢復任務,管理員手工選擇須要恢復的備份數據版本
    • 備份服務器在自身數據庫中尋找須要恢復的數據版本,並在備份設備中定位查找
    • 備份服務器經過以太網將數據傳輸給丟失數據的客戶端,客戶端接收待恢復的備份數據

高級備份恢復技術

LAN Free備份流程

  • 備份流程
    • 備份客戶端需安裝備份媒體介質服務器端軟件
    • 在備份服務器中設置備份任務及策略。
    • 備份服務器定時啓動備份任務,經過以太網發送控制命令通知備份客戶端開始備份。
    • 備份客戶端接收備份命令,啓動數據庫代理軟件保證數據庫的致性,並
    • 開始發送備份數據經過SAN網絡直接寫入到鏈接在自身的備份設備中。
      備份服務器接收客戶端寫入成功的信息,備份任務完成。

Server Less備份流程

  • 備份流程
    • 須要SAN交換機或備份設備支持此功能。
    • 在備份服務器中設置備份任務及策略。
    • 備份服務器定時啓動備份任務,經過以太網發送控制命令通知備份客戶端開始備份。
    • 備份客戶端接收備份命令,並傳達備份命令給SAN交換機或備份設備開始備份,備份數據不經過備份客戶端直接從磁盤陣列寫入到鏈接在SAN網絡的備份設備中。
    • 備份客戶端獲得完成信息,並將該信息經過以太網傳送給備份服務器,備份任務完成

數據恢復應注意的問題

  • 影響恢復時間的因素
    • 系統重構的時間
    • 是否具備快速恢復的功能
    • 須要恢復的數據的大小
    • 備份的類型
    • 備份的介質
    • 數據庫恢復
      • 數據恢復
      • 日誌恢復

數據庫恢復分類

  • 數據庫徹底恢復
  • 數據庫部分恢復
    • 恢復數據文件
    • 恢復表空間
    • 時間點恢復
  • 綜合性恢復
    • 表空間的時間點恢復

備份/恢復系統的規劃

  • 備份系統的規劃
    • 設計適合的備份系統結構
      • 對應用物理的影響
      • 考慮備份窗口是否與實際備份時間匹配
      • 備份介質容量
    • 定製合理的備份策略
      • 保證備份的數據可以充分知足各類狀況下數據恢復的需求
      • 使可恢復數據儘可能距災難發生點間隔最小
      • 可以充分知足數據保存時間的要求
    • 估計可容忍的故障恢復時間
    • 估計實際數據恢復所須要的時間
    • 定製恢復計劃
    • 具備恢復能力的專門恢復人員
      • 有關備份的一切相關資料
        • 備份系統的結構圖
        • 備份的執行狀況
        • 備份數據與備份介質的詳細關係

備份

  • 須要根據保留的時間與價值分開存放

  • 文件的複製與備份

  • window與linux系統的備份

  • 備份軟件與備份系統的備份

  • 備份計劃

    • 週期性備份
      • 每日/周/月
      • 每次開關機
  • 備份報告

    • 備份報告的管理
      • 備份報告應有專人定時編寫
      • 備份報告應存放在安全位置
        • 不會由於災難的緣由而丟失
        • 可讓數據恢復人員在最短的時間內取得報告
  • 恢復指標

    • 恢復時間
    • 恢復點
      • 容許最大的數據損失量

數據容災

災難恢復是指發生災難性事故的時候,利用系統恢復、數據備份等措施,及時對原系統進行恢復,以保證數據的安全性以及業務

  • 與備份的區別
    • 災難恢復包括系統恢復、數據恢復和應用恢復全過程
    • 災難恢復目標之一是保證業務的連續性
    • 系統備份與數據備份不一樣,他須要備份系統中安裝的應用程序、數據庫系統、 用戶設置、系統參數等。不是單純的數據複製
    • 容災要求有異地數據備份,甚至系統應用的異地備份

容災與備份的關係

區別

從定義上看,備份是指用戶爲應用系統產生的重要數據(或者原有的重要數據信息)製做一份或者多份拷貝,以加強數據的安全性。所以,備份與容災所關注的對象有所不一樣,備份關係數據的安全,容災關心業務應用的安全,咱們能夠把備份稱做是「數據保護」,而容災稱做「業務應用保護」.

聯繫

  • 備份與容災是存儲領域兩個極其重要的部分,兩者有着緊密的聯繫
  • 首先,在備份與容災中都有數據保護工做。其次,備份是存儲領域的一個基礎,在一個完整的容災方案中必然包括備份的部分;
  • 同時備份仍是容災方案的有效補充,由於容災方案中的數據始終在線,所以存儲有徹底被破壞的可能,而備份提供了額外的一條防線,即便在線數據丟失也能夠從備份數據中恢復。

容災指標

  • 以恢復點爲目標(RPO -- Recovery Point Object)
    • 數據的完整性(無數據丟失)
    • 數據的一致性(數據正確卻可用)
  • 以恢復時間爲目標(RTO -- Recovery Time Object)
  • 以網絡恢復爲目標(NRO -- Network Recovery Object)
  • 以服務支持能力爲目標(SDO -- Serviceability Degrade Object)
    • 性能
    • 地域/支持的客戶總數
    • 功能的限制

災難恢復與容災規劃

災難恢復等級

支持災難恢復各個等級所需的資源分爲7個要素

  1. 數據備份系統
  2. 備用數據處理系統
  3. 備用網絡系統
  4. 備用基礎設施
  5. 技術支持能力
  6. 運行維護管理能力
  7. 災難恢預案

共劃分6個等級

等級 詳細
第1級 基本支持
第2級 備用場地支持
第3級 電子傳輸和部分設備支持
第4級 電子傳輸及完整設備支持
第5級 實時數據傳輸及完整設備支持
第6級 數據零丟失和遠程集羣支持

容災的7個層次

  • 備份/恢復的範圍
  • 恢復計劃的狀態
  • 在應用中心與備份中心之間的距離
  • 應用中心與備份中心之間是如何相互鏈接的
  • 數據怎樣在兩個中心之間傳送的
  • 有多少數據被丟失
  • 怎樣保證更新的數據在備份中心被更新
  • 備份中心能夠開始備份工做的能力
0層

無異地備份數據(No off——site Data)

1層

有數據備份,無備用系統(Data Backup with No Hot Site)

2層

有數據備份,有備用系統(Data Backup with Hot Site)

3層

電子連接(Electronic Baulting)

4層

使用快照技術拷貝數據(Point-in-time Copies)

5層

交易的完整性(Transaction Integrity)

6層

0數據丟失(Zero Data Loss),自動系統故障切換

容災恢復與容災規劃

對於倚仗廳系統的企業來講,從確保業務連續能力的角度出發,能夠依據下列容災規劃步驟

  • 災難類型分析
  • 業務衝擊分析
  • 當前業務環節及恢復能力分析
  • 容災策略制訂
  • 容災方案設計
  • 業務連續性流程設計
  • 業務連續性流程及容災方案管理和測試

容災的IT實現

  • 除了詳盡的容災計劃,實際上還須要合理的系統架構來確保企業的容災計劃得以實現
  • 對於IT系統而言,在技術層面上,容災須要考慮:
    • 數據版本保護 - 創建容災的多版本保護底線(Bottom Line)
    • 實時數據保護 - 數據複製,近乎0的數據丟失,數據一致性
    • 應用系統恢復 - 恢復時間(包括數據庫恢復)、應用版本的一致性(PTF)等
    • 網絡系統恢復 - 數據訪問點變化、創建新網絡路徑、動態路由(收斂時間/穩定性)
    • 容災切換決策 - 即便發現災難(容災系統管理)、容災切換的損失和補救方法
    • 容災切換過程 - 變換管理

一般狀況下IT系統相關的災難備份方案設計都必須考慮的五大因素

  • 災難類型:須要考慮哪些災難?怎樣的災難?會使業務中斷多久?
  • 恢復速度:災難發生後須要多久來啓動及運行系統?可否承受數天或數分鐘的等待?
  • 恢復程度:須要恢復每條記錄和交易嗎?能夠使用上星期或昨天的數據嗎?須要恢復一切嗎?有不相關的文件嗎?什麼是合法隱含的要求?有少數的一組人輸入交易嗎?他們能夠從新輸入災難期間丟失的交易嗎?這些交易十分重要而不允許丟失嗎?
  • 可用的技術:必須結合考慮所選技術在本地區的適用性、實現條件以及在實施時是否受某些現有條件的制約?
  • 方案整體成本:實現災難備份須要多少投資?不實現災難備份會損失多少錢?

容災涉及的恢復技術

  • 應用恢復
  • 網絡恢復
  • 數據恢復

同城容災和異地容災

  • 同城容災
    • 同城容災是在相近區域創建兩個數據中心:一個爲生產中心,負責平常生產運行;一個爲災難備份中心。
    • 同城容災因爲距離近,帶寬大,常常採用同步鏡像
    • 能夠防範火災,建築物倒塌等災害;
  • 異地容災
    • 生產中心與災難備份中心至少相距100Km以上
    • 常常採用同步鏡像
    • 能夠防範地震、水災和戰爭等
  • 同城容災和異地容災各有所長,建議銀行等特殊企業,能夠考慮同時構建同城容災和異地容災。

固態硬盤

不像機械硬盤,一旦有一個位置損壞整個固態硬盤就損壞沒法使用了

  • 由主控芯片控制,爲了保證不讓某個地方損壞因此芯片的使用壽命次數須要保證平衡

  • SLC複寫次數:10w次

  • MLC複寫次數:1W次(只有SLC的十分之一)

  • TLC複寫次數:500次

固態分類

  • 基於DRAM的固態硬盤
    • 採用DRAM做爲存儲介質,目前應用範圍較窄
    • 不能斷電,須要永久通電,一般會有獨立電源供電保證數據安全

固態接口類型

  • SSD固態硬盤主流接口類型分爲:
    • SATA

SSD性能優點

  • 響應時間短
  • 讀寫效率高

功耗優點

  • SSD功耗小於機械硬盤
  • 兩塊SSD=250塊機械硬盤的功耗

SSD的環境適應優點

  • SSD不含高速旋轉的機械結構部件,可經得住嚴苛的環境考驗
    • SSD可承受加速度16.4G,機械硬盤通常爲0.5G如下
    • SSD抗衝擊150G,機械硬盤通常爲70G左右
  • SSD使用專用設備作過以下測試:
    • 靜壓試驗、跌落試驗、隨機振動試驗、衝擊試驗、碰撞試驗

固態硬盤優勢

  • 啓動快
    • 沒有電機加速旋轉的過程
  • 快捷,讀取延遲小
    • 不用磁頭,快速隨機讀取,讀延遲極小
  • 輕量
  • 碎片不影響讀取時間
    • 相對固定的讀取時間
  • 寫入速度快
    • 基於DRAM的固態硬盤寫入速度極快
  • 無噪音
    • 由於沒有機械馬達和風扇
  • 發熱量較低
    • 低容量的基於閃存的固態硬盤在工做狀態下能耗和發熱量較低
  • 不會發生機械故障
    • 內部不存在任何機械活動部件
  • 省電
    • 工做環境可在,典型:5-55°,工業:-10°~70°工做環境
  • 工做溫度範圍更大
  • 體積小重量輕
  • 抗震動

固態硬盤缺點

  • 成本高
    • 每單位容量價格是傳統硬盤的5-10倍(基於閃存)
  • 容量低
    • 目前固態硬盤最大容量遠低於傳統硬盤
  • 易受外界影響
  • 寫入壽命有限
  • 數據難以恢復
    • 數據損壞後難以恢復,一旦硬件上發生損壞,要想在碎成幾片或被電流擊穿的狀況下恢復幾乎不可能
  • 電池航程較短
  • 能耗較高

SSD各類指標

  • 順序讀取/寫入速度
  • 4K性能
    • 4K是大小,4096字節
  • SSD讀寫原則和預留空間
    • 按頁存儲數據,寫數據時須要先檫除整塊區塊才能更新寫入
    • 爲了讓用戶隨時都能覆蓋數據,因此須要保存一些空白空間或者是預留空間
    • 通常製造商會預留遠高於最低7.73%的空間,高端的SSD會預留高達28%的空間(512GB實際只有400GB可用)

SSD存儲顆粒

  • 從成本上來講NAND閃存大概能佔SSD硬盤物料成本的70%或更多
  • 大部分來自山西、東芝、美光、西數、英特爾
  • 四大陣營:三星、SK Hynix、東芝/西數、美光/英特爾

主控芯片

  • 通常來講主控芯片的成本佔據SSD硬盤10-15%
  • 主控芯片是固態硬盤的大腦

早期主控產品

  • 早期主流是:Intel、SandForce、Marvell
  • SandForce因爲比較好一直被收購最終被希捷收購,目前因爲頻繁收購已經沒落了
  • JMicron:性能很差功耗大,屬於垃圾物品,可是廉價,因此撬動了大部分市場並受大部分山寨青睞

image-20200414091907615

主控發展狀況

  • 目前可劃分爲美系、臺系、陸系

主控品牌分系

美系主控品牌

  • 美滿電子
  • 慧榮科技 SMI
  • Marvell 馬牌,大衆認知上也是頂級的主控品牌
  • SandForce 因爲被屢次收購開始衰落

臺系主控品牌

  • JMicron 便宜功耗大,受山寨青睞因此推進了市場
  • 目前風頭最勁的是羣聯電子
  • 點序科技也是臺系不可忽視的一直中堅力量

大陸系主控品牌

  • 江坡龍、憶芯科技、聯芸科技...
  • 國產主控還有一個特別的優點,那就是支持國內認證的安全加密

數據恢復工具使用

WinHex

  • 對系統要求低、方便攜帶

PC3000

俄羅斯

效率員

硬盤數據組織

  • 硬盤須要通過低格、分區、高級格式化後才能使用
    • 低格
      • 做用:測試硬盤介質、爲硬盤劃分磁道、指定交叉因子,安排扇區、寫入扇區id,完成扇區設置、對磁盤表面測試,標記損壞磁道和扇區
    • 分區:便於硬盤的規劃和文件的管理、有效的利用空間、提升系統效率、創建MBR
      • 分區粒度一一分區最小單位是柱面
  • 分區
    • 將硬盤劃分爲一個個邏輯區域。每一個分區有肯定的起、止位置

    • 分區的信息記錄在一個特殊位置的扇區,成爲硬盤主引導記錄( Master boot recorder,MBR或主引導扇區

    • MBR位於0磁頭,0磁道,1扇區

FAT文件系統

概念

MBR

image-20200514225821891

FAT的第一扇區是MBR(佔63扇區,第6個扇區用做備份),結束標誌是55AA、前64個字節是分區表,16個字節爲一個分區,上圖只有一個分區

image-20200514230605262

  • 第一個字節是自舉標誌,全部分區的第一字節要麼是00或80

  • 後面三個字節是CHS起始位置

  • 後面的字節應該是07,代表是分區類型NTFS(虛擬機上可能不同)

  • 後面三個字節是CHS結束位置

  • 後面八個字當前四個是分區其實位置,後四個是分區大小

  • 文件分配表FAT是dos文件管理系統用來記錄每一個文件的在儲位置的表格,它叫鏈的方式存放簇號

  • 根目錄下全部文件和子目錄,在根目錄的文件目錄表中都有一個記錄-「目錄登記項」。每一個目錄登記項佔32個字節

計算

  • 在winhex中的值都須要反過來

    # 例如
    3F 00 00 00 -> 00 00 00 3F
    9A E5 3F 01 -> 01 3F E5 9A
  • 高位的0能夠省略,十六進制的3f轉換成十進制63(MBR大小佔63個扇區,C盤是緊接着MBR的扇區)

  • 將13FE59A轉換成十進制20964762(代表C盤這個分區佔了20964762個扇區),再

高級格式化(FAT格式)

低格→分區後就會有MBR(63個扇區),而後進行FAT32格式化(高級格式化)。在硬盤中創建DBR(32個扇區),記錄着分區的重要信息(若是被破壞,數據就丟失);在此基礎上創建FAT1(FAT2是備份,兩個FAT如出一轍),DIR是根目錄(資源管理器打開顯示的磁盤),最後是數據區域。

  • 在分區內,對扇區進行邏輯編號

  • 在基本分區創建DOS引導記錄DBR

  • 在邏輯盤創建文件分配表FAT

  • 創建文件目錄表FDT及數據區

  • image-20200428085021863

  • FAT表有2個

  • DBR區可參考項

    • DBR( DOS Boot Record),操做系統引導記錄區。一般位於硬盤0柱1面1扇區,是操做系統能夠直接訪問的第一個個扇區。它包括引導程廳和一個被稱爲BPB( BIOS Parameter Block)的本分區參數記錄表
    • 高級格式化將DOS引導記錄寫到該扇區。引導程序的主要任務是,當MBR將系統控制權交給它時,判斷本分區根目錄前兩個文件是否是操做系統的引導文件。以DOS爲例,便是O.SYS和 MSDOS.SYS。低版本的DOS要求這兩個文件必須是前兩個文件,即位於根目錄的起始處,佔用最初的兩個目錄項,高版本已沒有這個限制。另外, Windows與DOS是一個家族,因此Windows也沿用這種方式,只是文件名不同。

image-20200428105459942

DBR結構

DBR是操做系統能夠直接訪問的第一個扇區,結束標誌和MBR的同樣,區別:

  1. MBR是在硬盤的起始處,而DBR是在分區的起始處。
  2. MBR有分區表,DBR沒。
  3. winhex打開C盤沒有MBR,打開硬盤纔有。

image-20200515003252313

  • 5部分,操做系統能夠直接訪問的第一個扇區是DBR,FAT的第0、1簇爲保留簇,其中,首字節表示DBR
  • 跳轉指令
    • 兩個字節,將程序跳轉到自舉代碼處,EB3C;EB58等(EB表明彙編語言的JMP)。因爲自己佔兩個字節,因此實際位置是3E,5A。其後是空指令NOP(90)
  • 廠商標誌和Dos版本號
    • 8個字節(03-0A)
  • BPB(BIOS Parameter Block)
    • 從第12個字節開始,佔用52(0B-3E,FAT12/16)或80(0B-5A,FAT32)個字節
  • Dos引導程序
    • 448字節(3E-1FD)或420字節(5A-1FD):負責Dos系統文件裝入
  • 結束標誌
    • 55AA
  • 5個部分共有512字節,正好是一個扇區,因此成爲dos引導扇起或bot扇區;除告終束標誌是固定不變的,其餘4個部分隨着dos版本不一樣而變化
  • DBR佔用32個扇區(實際只佔用第1和第6兩個扇區,第1扇區起做用,第6扇區爲第一扇區的備份)

image-20200428085540744

  • 用winhex打開磁盤首先看到的是DBR的跳轉指令 EB 3C;EB 58
    image-20200515003553030

  • 結束標記
    image-20200515003606815

  • 若是跳轉第六個扇區(備份扇區)也是如出一轍的(若是第一個扇區被破壞,能夠從這複製)

  • 在winhex右邊點擊引導扇區(模板)能夠將數據用列表的形式表現
    image-20200515003803442

  • 跳轉指令
    image-20200515003827877

  • 只要是有數據,起碼佔8個扇區(即一個簇)。簇是文件系統中讀寫數據的最小的單位(硬盤的邏輯劃分最小單位是扇區)(分區的劃分最小單位是柱面)
    image-20200515003842857

  • 雖然大小隻有10個字節,但以簇的形式能夠提升管理的效率,但利用率降低,因此佔用空間雖不滿,但別人也不能用。若是大小變大了,管理效率調高了可是佔用空間就大了,若是小了佔用空間就小了但管理效率就低了
    image-20200515003859560

  • 此處F8說明訪問的是硬盤
    image-20200515004013886

FAT32

可參考項1 可參考項2

image-20200515004107342

  • 以鏈的方式存放簇號,前一個記住後一個。011(F80F)爲默認,從這以後是數據
    image-20200515004141324
  • FAT32 - 32位,4個字節記錄一個簇,由於用四個字節記錄一個簇(因此*4),一個字節8bit,因此叫FAT32.
    image-20200515004212221
  • 文件名
  • 佔8位
  • 文件後綴名
    • 佔3位,早期文件後綴名只有三個字節的位置,因此都是3個爲主(exe、txt、ini、 jpg、png...),雖然如今擴展了4個
  • 屬性
    • 佔一位,
    • 20表示文件,10表示目錄
    • 06表明系統文件,病毒經常會將本身修改爲系統文件,若將其屬性修改了也會自動刷成系統文件
  • 存儲的起始位置
    • 高位取反+地位取反,高位正數 56,地位倒數56
    • 00 05 00 0C(真正的其實位置)
  • 文件大小
    • 取反 00 00 0B FD ->轉換十進制獲得的數就是文件大小,單位位字節

image-20200428095227484

2E - .(點號
20 -  (空格
  • 一個目錄項做爲長文件名目錄項使用時,其屬性字節(0BH字節)值爲0F
  • 若文件名過長則使用分段存儲,分段存的長度爲562562562...的分段存儲,存儲的編碼也改變了,爲Unioncode
  • 屬性一共八位: 0000 0000
    • 高四位
      • 0010 0000 = 20 當前的記錄是一個文件
      • 0001 0000 = 10 當前的記錄是一個目錄
    • 第四位
      • 0000 0001 = 01 只讀文件
      • 0000 0010 = 02 隱藏文件
      • 0000 0100 = 04 系統文件
    • 若是屬性位爲22,則記錄爲隱藏的文件

文件恢復

  • 將文件delete,文件放到了回收站,則在資源管理器中,文件以E5開頭,若文件以此開頭則會默認略過他,此標記是做爲廢棄文件使用
  • 文件刪除其實只是將文件改成E5開頭,並在回收站中產生一個文件連接的記錄,若是是將磁盤格式化,也只是將文件記錄和fat表給清除,但目錄下的文件夾子目錄記錄還會在扇區中因此能夠跳轉至起始蔟,可是若是格式化的文件沒有放入文件夾的話,那文件記錄就會丟失

若是須要查找中文名的文件夾,假設爲新的文件.TXT則須要先建立一個txt,在裏面輸入新的文件保存爲unicode編碼後在winhex打開,以unicode保存的文件開頭爲FFFE後八位爲編碼後的新的文件文件名--B065FA5E87652C67

恢復一個文件

這裏以一張jpg爲例子,文件名爲abc.jpg,爲了好觀察,首先咱們截一張圖存放在一個空的盤,而後打開winhex選擇指定的磁盤後打開根目錄,找到abc.jpg這個文件名,找到以後這兩行都是被這個文件佔用了的,第二行從作左往右數第五、6位是文件的其實存儲位,第二行倒數第56位是結束存儲的位置,第二行最後四位是文件的大小

  • 正數:00 00
  • 倒數:08 00
  • 文件存儲簇:00 00 00 08
  • EC BB 00 00
  • 文件大小00 00 B8 EC
    • 轉換十進制大小:48108
    • 末尾的偏移位:5D(十進制數除以512=93轉16進制)
  • 移動到簇8後選擇爲起始,再偏移至5D sec後選擇爲結束,將所選的內容保存爲文件導出則爲abc.jpg 圖片

winhex中分析FAT32文件

系統讀取文件會首先查看0x0B位,這一位說明了此文件爲長文件名文件仍是短文件名文件,短目錄項就是文件名長8位、後綴爲3位的文件,更長的文件名須要長文件名,通常0F表示爲長文件名

image-20200514212309065
  • 長文件名部分0009D020-0009D030
    • 0x01中的41表明了0009D020-0009D030放置着unicode文件名,41的1字表示他是第一段,若是還有更長的則在個位數上疊加
    • 0x0B中0F是長文件名的表示
    • 0x0C的00是用做保留
    • 0x0D的D2則是用於校驗
    • 其他部分用於存儲unicode,其中的長文件名一直到00 00做爲字符串結束標誌,多餘部分的用FF填充
    • 爲了檢驗其中的unicode碼內容,咱們用文本編輯器輸入新建 文本文檔.txt保存爲unicode的格式用winhex打開,能夠看到從FFFE開始後面的十六進制數與從04行開始的65FA5E....一致,而文件的格式名740078007400則在0009D020的0x0d-0x09
      image-20200515000006093
  • 短文件名部分0009D040-0009D050
    • 0x00-0x07表示這其文件名
    • 0x08-0x0A的54 58 54則表明文件後綴名txt文件
    • 0x0B的20記錄表明了這是一個文件
    • 0x0C的00爲保留所用
    • 0x0D列爲建立時間的10毫秒位
    • 0x0E-0x0F列表示文件的建立時間,若是要對其計算則須要翻轉,也就變成A6 E6,再對其進行換算
    • 0x10-0x11表示文件的建立日期,也是須要對其進行翻轉,變成50 AE
    • 0x12-0x13表示文件的最後訪問日期,計算的時候須要翻轉爲50 AE
    • 0x14-0x15表示起始簇高字節,計算的時候須要翻轉爲00 00
    • 0x16-0x17表示文件最後的修改時間,計算的時候須要翻轉爲A6 37
    • 0x18-0x19表示文件最後的修改日期,計算的時候須要翻轉爲50 AE
    • 0x1A-0x1B表示起始簇低字節,計算的時候須要翻轉爲00 03,將高位和低位加起來:00 00 00 03,將其轉換成十進制也就表示這個文件存放在03簇
    • 0x1C-0x1F表示文件的大小,計算的時候須要將18 00 00 00翻轉爲00 00 00 18,轉換十進制爲24個字節

查看存儲的簇

  • 首先咱們從上面獲得了此文件在03簇,在位置->跳轉至扇區
    image-20200515000521165
  • 能夠看到其中存儲的內容與E盤文本文件中的內容一致
    image-20200515000613030

恢復文件

上面你已經學會了查看簇與計算文件大小,接下來會用到的!

  • 首先咱們將桌面截圖保存jpg圖片文件到E盤中
    image-20200515002740150

  • 而後將他刪除,從winhex中打開E盤
    image-20200515000909347

  • 0009D0A0中0x0B爲0F因此這是一個長文件,0009D0C0的0x0B爲02因此這部分是表示這是一個文件,其他咱們能夠無論這裏只作恢復因此重要的是看0009D0D0這一行

      • 起始簇高字節:0x15-0x16 -> 00 00
      • 起始簇低字節:0x1A-0x1B -> 04 00
      • 彙總(高 低):00 00 04 00 分別翻轉後獲得-> 00 00 00 04
    1. 文件大小

      • 0x1C-0x1F -> BA 55 00 00
      • 翻轉後獲得 :00 00 55 BA
      • 轉換成十進制後除以512=42(字節)再轉換成十六進制數得:2A(偏移所用)
    2. 這裏獲得了簇是用於定位被刪除文件的起始位置,文件大小計算所得的2A是用於定位被刪除文件的結束位置

      • 選擇菜單欄的位置->跳轉至扇區輸入簇值爲4,此時咱們定位到了被刪除文件的其實位置,右鍵選擇選快其實位置
        image-20200515001848451

      • 而後選擇菜單欄的位置->跳轉偏移量,輸入剛剛計算獲得的十六進制數2A,將後面的單位改成Sectors,並選擇從當前位置開始
        image-20200515002034473

      • 跳轉後選擇其前一次字節,右鍵並選擇選快尾部

        image-20200515002323398

      • 此時咱們就選擇了一塊區域,這塊區域就是圖片的內容,在藍色的區域右鍵編輯-複製選快-至新文件,將其保存到任何地方都行,記得後綴別弄錯了是jpg
        image-20200515002511829

      • 完成!
        image-20200515002557563

NTFS

參考

  • NTFS是windows想搶佔服務器行業所作的新文件系統,參照了Unix和linux,一切都是文件不想FAT中有其餘的東西
  • 一個文件記錄的大小是1KB=1024個字節,佔用兩個扇區
  • 新特性
    • 容錯:NTFS可自動修復磁盤錯誤而不顯示出錯信息Windows在向NTFS分區寫入文件時,在內存中保留一份文件拷貝,而後檢査寫入的文件與拷貝是否一致,如不一致, windows就把相應的扇區標爲壞扇區,而後用內存拷貝從新向磁盤寫文件。
    • 安全:支持加密文件系統EFS,受權用戶訪問文件能夠在本機和遠程保護文件
    • 文件壓縮:支持文件壓縮,單個文件或整個文件夾
    • 磁盤配額:容許系統管理員給用戶分配磁盤空間,用戶只能訪問本身的文件
  • 在NTFS中,文件的全部信息,包括文件名全部者、時間、內容等,都是做爲NTFS對象的屬性來實現的;因此NTFS文件可包含多個數據流
  • NTFS文件有默認的數據流,沒有名稱。應用程序能夠建立具備名稱的數據流,而且經過名稱來訪問這些數據流:經過在文件名後加上「:」再加上數據流名稱來完成。
    例如: Myfile.txt: Stream1

NTFS的DBR的BPB參數表

image-20200512090658195

NTFS分區的區域結構

image-20200512090412051

  • 在NTFS文件系統中,文件也是按簇分配的,一個簇老是扇區數的2的整數次方;磁盤上的任何事物都是文件,文件經過主文件表來肯定存儲位置
  • 主文件表是一個與文件對應的數據庫,由一系列文件記錄組成。主文件表也有自身的記錄文件
  • MFT僅供系統自己組織、構架文件系統使用,在NTFS中稱爲元數據( Metadata,是存儲在捲上支持文件系統格式管理的數據,不能被應用程序訪問,只能爲系統服務)
  • 最基本的前16個記錄是操做系統使用的很是重要的元數據文件。這些元文件名字都以「$」開始,是隱藏文件(經過NFI.EXE可顯示)

MFT

  • MFT中的文件記錄大小是固定的,無論簇的大小是多少,均爲1KB.(至關於 Linux中的一個 inode
  • 文件記錄在MFT文件記錄中是物理上連續的,從0開始編號

NTFS元文件

image-20200512090518071

  • 文件記錄長度可變,末尾以4個FFFF結束

  • 文件記錄頭的結構

    二進制 數值 表示
    0000 0000 0 該記錄爲文件
    0000 0001 1 正在使用的文件
    0000 0010 2 該記錄爲目錄
    0000 0011 3 這種使用的目錄

    屬性結構

  • 總體結構可分爲兩個部分

    • 屬性頭 - 常駐屬性頭、很是駐屬性頭
      • 常駐 10 30 50 80 90
        • 常駐屬性頭偏移位0x00-0x18,在winhex中爲一行半,因此屬性頭若是沒有超過兩行則爲常駐屬性頭
      • 很是駐 80 A0
        • 若是屬性頭長度超過兩行則爲爲很是駐屬性頭
        • 若是此條記錄爲很是駐,則末尾會有一條深色的記錄,記錄着屬性的運行地址
      • 80爲文件數據屬性
        • 可變屬性頭(特殊的)
        • 具體看淺色部分的行數
          • 未超過兩行的常駐屬性,深色的部分爲存儲的數據,將其複製至新文件便可恢復,若是是
          • 超過兩行的很是駐屬性,深色部分須要計算,計算後獲得的便是存儲的數據
      • 10 標準信息屬性
      • 30 文件名屬性頭
        • 若是一個文件有兩個30文件名屬性,則表示這個文件爲長文件名,第一個爲長文件名,第二個爲短文件名,因爲歷史緣由短文件名是系統默認保留的
        • 如何區分短文件名和長文件名?看十六進制數中是否出現了7E 00 31表明這~ 1
      • 90 索引根屬性
        • image-20200525223229902
      • A0索引分配屬性
    • 屬性內容
      • 程序運行,本質上是一個連續存儲的空間,運行的時候原本使用的空間不足則會到存儲空間中劃分一塊空間繼續使用,不夠則繼續劃分

image-20200525210456717

很是駐文件分析與文件恢復

若是80屬性中淺色部分超過兩行,則表示這是一個很是駐屬性

  • 全部的文件或文件夾都從FILE開始,即46 49 4C 46 30
  • 每一個文件的第三行的C列都記錄着是第幾個文件記錄(編號),假如是1D那就是第29個文件夾記錄
  • 在ntfs中若是文件被刪除,出了第二行的第六列會從01改成00,其餘都不會變,0表示文件,0是偶數表示被刪除的
  • 在ntfs中硬盤格式化並無將文件數據刪除,但文件記錄會被刪除
起始的第一個字節的高位+低位是運行記錄的大小:3+2 = 5
32 1F 01 F8 52 07 00 00
32:1F 01 F8 52 07
# 高位3 表示後三位是運行的起始簇號
3:F8 52 07 -- 07 52 F8 --479992 起始位置
# 低位2 表示前兩位是運行的簇大小
2:1F 01 -- 01 1F - 287簇(cluster) * 8 = 2296 扇區(sector)
----------案例二
31 5D A2 63 04 00 01 00
31 5D A2 63 04 
3:A2 63 04 -- 04 63 A2 -- 287650
2:5D -- 5D -- 93 *8=744 -- 2E8
將起始位置簇爲287650,也能夠跳轉至扇區/8=35956扇區選中,而後再偏移2E8個扇區後將文件複製保存到新文件便可
# 多運行地址的狀況:31,3+1=4第五個數後面仍是有值,因此繼續相加
31 09 5A FE 13 31 03 87 01 FD 00 00 00 70 48 E1
FD後面都是廢棄數據
31:09 5A FE 13 -- 
3:13 FE 5A - 1310298(相對位置,相對於硬盤的起始位置)
1:09
-----
31:03 87 01 FD -- 
3:FD 01 87 -16580999(相對位置,相對於上一個位置的起始位置,因此須要加起來) +1310298 = 17891297
1:03
# 須要將這兩個文件數據拼起來才能變成一個完整的文件

常駐文件的恢復

常駐文件只須要找到文件所在的簇,常駐文件的80屬性頭部分(淺色)是不超過兩行的,後面的深色部分都是數據,將其複製至新文件保存便可

文件夾分析與恢復

  • 一開始建立目錄的時候只有90屬性,文件下的文件記錄放置在90中,若是文件夾內的東西愈來愈多,90索引根屬性放不下了,就會建立一個A0索引分配屬性,將90的東西放到A0中
  • 長文件名會有兩個30,十六進制數7E 00 31表明的~ 1是短文件名的標誌,$I30`是90和A0屬性文件名特有的名字
  • 若是文件夾內索引內容超過2個扇區,則會放到索引扇區,以INDX開頭
  • image-20200524215604249

新建一個文件夾

image-20200520232440692

添加一個文件

image-20200520232853158

  • 如何查看b.txt所在位置?首先看文件的文件記錄號:21 00,將其翻轉則爲00 21,注意這是十六進制數,要轉換爲十進制數得33*2=66再轉十六進制數爲42,而後從主文件記錄開始向後跳轉42個sectors跳轉到記錄着b.txt的文件記錄區域,再找到高光區域的數字對其計算便可找到

添加第二個文件

image-20200520234231858

添加一個長文件名

image-20200520235013825

當文件夾下文件過多時

若是文件記錄2兩個扇區放不下了,就會將90屬性值內的記錄項移動到了A0屬性值內

image-20200520235539760

這裏計算一次很是駐屬性的A0,將其其實位置計算出來,而後跳轉到A0的其實簇:39161簇

31 01 F9 98 00
3:00 98 F9 - 39161
1:01

image-20200521000148339

RAID

概念

  • 是獨立冗餘磁盤陣列的英文縮寫,人們在開發RAID時主要是基於如下設想:即幾塊小容量的使盤的價格總和要低於一塊大容量的硬盤。
  • 雖然RAID在節約成本方面的做用不是很明顯,可是RAID能夠充分發揮多塊硬盤的優點,實現遠遠超出一塊單獨硬盤的速度和吞吐量或提供遠超過一塊硬盤的容錯能力

原理圖

與單盤系統不一樣,單盤系統數據是寫在單獨的硬盤,RAID是同時讀寫,在讀寫的時候會將數據進行切片

image-20200526090502095

經常使用的RAID級別與分類標準

  • RAID技術將多個單獨的物理硬盤以不一樣的方式組合成一個邏輯硬盤,提升了硬盤的讀寫性能和數據安全性,根據不一樣的組合方式能夠分爲不一樣的RAID級別。
  • image-20200526085104435

RAID的幾種狀態

若進入降級速度會驟降,若是進入這個狀態則須要注意設備更換或修復,不然RAID失效很難進行數據恢復

image-20200526085345144

RAID0

  • RAID 0是最先出現的RAID模式
  • 讀寫時所有硬盤同時運做,因爲沒有冗餘若是其中一塊硬盤損壞,則所有數據損壞
    • image-20200526085426057
  • 若數據損壞須要將損壞的盤換上,支持熱拔插的設備拔下則須要一分鐘內更換
  • 整個邏輯盤的數據被分散分佈在多個物理盤上,並行讀寫。(沒有冗餘能力)
  • 特色
    • 利用率100%
    • 讀寫效率高,理論上爲單盤的N倍
    • 無容錯能力,安全性低於單盤
  • DAID須要注意的參數
    • 盤序
      • 數據先寫在哪那個塊就是第一個塊,若是要恢復數據就須要先找到數據的讀寫順序
    • 塊大小
      • 一個D0叫塊
      • D0和D1叫條塊
    • RAID信息

image-20200526090133959

RAID1

  • 數據讀寫同時分別寫在兩塊硬盤中,若是其中一塊硬盤損壞或數據損壞,能夠直接從另外一塊硬盤中恢復
    • image-20200526091208683
  • 把一個磁鹽的數據鏡像到另外一個硬鹽上,一般在兩塊盤上實施
  • 特色
    • 利用率低:1/N
    • 讀寫效率好,寫效率通常
    • 容錯性好
  • RAID1須要注意參數
    • RAUD信息

RAID3

  • 須要三塊硬盤,不能自動恢復數據若數據損壞須要將損壞的盤換上,支持熱拔插的設備拔下則須要一分鐘內更換
  • 工做原理使用上了異或校驗碼,拿出其中一塊硬盤作異或運算,由於0^0=00^1=11^0=11^1=0,若第一塊硬盤壞了則經過異或校驗能夠反向得出損壞的那塊硬盤的數據,但兩塊就不行了
    • image-20200526091432298

RAID5 (應用最普遍)

  • 須要三塊硬盤以上,讀寫的時候將校驗碼分別存儲在不一樣的硬盤中,好比寫入D0和D1時會生成P0校驗值再存儲,若其中一塊硬盤損壞會自動恢復不須要更換硬盤,但兩塊就不行了,RAID 5 (能夠理解爲是RAID 0和RAID 1的折衷方案
  • 寫入速度會稍微慢,由於須要生成校驗快,讀取則很快,由於不設計校驗碼
  • image-20200526092302925
  • 若是有三塊500g的硬盤組成RAID5,則構成的空間是1T,由於其中一塊(分別加起來)用做校驗
  • RAID5是應用最普遍的,可是最難恢復數據的,由於不知道數據的讀寫順序,整個邏輯盤的數據以條帶方式被分散分佈在多個物理盤上(3塊以上),每一個條帶中設置專門一個數據塊存儲該條帶的異或校驗。
  • 特色
    • 利用率:(N-1)/N
    • 讀效率稍高,寫效率稍差
    • 容錯性:容許一塊硬盤故障
  • 須要注意的參數
    • 盤序
    • 塊大小
    • 校驗方式
    • RAID信息

RAID6

雖然安全性好容許兩塊硬盤損壞,但因爲須要進行計算,性能不搞,使用人也很少

  • RAID6是帶有兩種校驗的獨立磁盤結構,採用兩種奇偶校驗方法,須要至少N+2(N>2)個磁盤來構成陣列,通常用在數據可靠性、可用性要求極高的應用場合
  • 經常使用的RAID6技術有RAID6 P+QRAID6 DP
  • 原理
    • RAID6 P的工做原理,P做橫向校驗,Q做斜向校驗
      image-20200526093222260
    • RAID6 DP的工做原理,能夠經過斜向校驗獲得其中一個數據,也能夠經過橫向校驗獲得其中一個數據
      image-20200526093309512

RAID10

  • 混合陣列,性能好,但一旦出現數據損壞則會難以修復

image-20200526093857505

RAID50

  • 混合陣列,性能好,但一旦出現數據損壞則會難以修復
  • RAID50是將RAID5和RAID0進行兩級組合的RAID級別,第一級RAID5,第二級爲RAID0.

image-20200526093924924

RAID6

  • RAID6容許任意兩塊硬盤同時出現故障任然能夠保證數據有效

經常使用RAID級別的比較

image-20200526094037114

應用場景

image-20200526094804868

文件恢復

((差值的十六進制)*4後轉十進制)/512

  1. 肯定盤序
  2. 肯定塊大小
相關文章
相關標籤/搜索