硬盤 SMART 檢測參數詳解[轉]

1、SMART概述算法

 

  硬盤的故障通常分爲兩種:可預測的(predictable)和不可預測的(unpredictable)。後者偶而會發生,也沒有辦法去預防它,例如芯片忽然失效,機械撞擊等。但像電機軸承磨損、盤片磁介質性能降低等都屬於可預測的狀況,能夠在在幾天甚至幾星期前就發現這種不正常的現象。若是發生這種問題,SMART功能會在開機時響起警報,至少讓使用者有足夠的時間把重要資料轉移到其它儲存設備上。 
  最先期的硬盤監控技術起源於1992年,IBM在AS/400計算機的IBM 0662 SCSI 2代硬盤驅動器中使用了後來被命名爲Predictive Failure Analysis(故障預警分析技術)的監控技術,它是經過在固件中測量幾個重要的硬盤安全參數和評估他們的狀況,而後由監控軟件得出兩種結果:「硬盤安全」或「不久後會發生故障」。編程

  不久,當時的微機制造商康柏和硬盤製造商希捷、昆騰以及康納共同提出了名爲IntelliSafe的相似技術。經過該技術,硬盤能夠測量自身的的健康指標並將參量值傳送給操做系統和用戶的監控軟件中,每一個硬盤生產商有權決定哪些指標須要被監控以及設定它們的安全閾值。 
  1995年,康柏公司將該技術方案提交到Small Form Factor(SFF)委員會進行標準化,該方案獲得IBM、希捷、昆騰、康納和西部數據的支持,1996年6月進行了1.3版的修正,正式改名爲S.M.A.R.T.(Self-Monitoring Analysis And Reporting Technology),全稱就是「自我檢測分析與報告技術」,成爲一種自動監控硬盤驅動器無缺情況和報告潛在問題的技術標準。 
  做爲行業規範,SMART規定了硬盤製造廠商應遵循的標準,知足SMART標準的條件主要包括: 
  1)在設備製造期間完成SMART須要的各項參數、屬性的設定; 
  2)在特定系統平臺下,可以正常使用SMART;經過BIOS檢測,可以識別設備是否支持SMART並可顯示相關信息,並且能辨別有效和失效的SMART信息; 
  3)容許用戶自由開啓和關閉SMART功能; 
  4)在用戶使用過程當中,能提供SMART的各項有效信息,肯定設備的工做狀態,並能發出相應的修正指令或警告。在硬盤及操做系統都支持SMART技術而且開啓的狀況下,若硬盤狀態不良,SMART技術可以在屏幕上顯示英文警告信息:「WARNING:IMMEDIATLY BACKUP YOUR DATA AND REPLACE YOUR HARD DISK DRIVE,A FAILURE MAY BE IMMINENT.」(警告:馬上備份你的數據並更換硬盤,硬盤可能失效。) 
  SMART功能不斷從硬盤上的各個傳感器收集信息,並把信息保存在硬盤的系統保留區(service area)內,這個區域通常位於硬盤0物理面的最前面幾十個物理磁道,由廠商寫入相關的內部管理程序。這裏除了SMART信息表外還包括低級格式化程序、加密解密程序、自監控程序、自動修復程序等。用戶使用的監測軟件經過名爲「SMART Return Status」的命令(命令代碼爲:B0h)對SMART信息進行讀取,且不容許最終用戶對信息進行修改。緩存

 
  2、SMART的ID代碼安全

 

  硬盤SMART檢測的ID代碼以兩位十六進制數表示(括號裏對應的是十進制數)硬盤的各項檢測參數。目前,各硬盤製造商的絕大部分SMART ID代碼所表明的參數含義是一致的,但廠商也能夠根據須要使用不一樣的ID代碼,或者根據檢測項目的多少增減ID代碼。通常來講,如下這些檢測項是必需的: 
  01(001) 底層數據讀取錯誤率 Raw Read Error Rate 
  04(004) 啓動/中止計數 Start/Stop Count 
  05(005) 重映射扇區數 Relocated Sector Count 
  09(009) 通電時間累計 Power-On Time Count (POH) 
  0A(010) 主軸起旋重試次數(即硬盤主軸電機啓動重試次數) Spin up Retry Count 
  0B(011) 磁盤校準重試次數 Calibration Retry Count 
  0C(012) 磁盤通電次數 Power Cycle Count數據結構

  C2(194) 溫度 Temperature 
  C7(199) ULTRA DMA奇偶校驗錯誤率 ULTRA ATA CRC Error Rate 
  C8(200) 寫錯誤率 Write Error Rate架構

 

3、SMART的描述(Description)ide

 

  描述,即某一檢測項目的名稱,是ID代碼的文字解釋。對用戶而言,不只要了解描述的含義,重要的是要了解各參數的值如「臨界值」、「最差值」的定義,「當前值」與「數據值」的區別等,才能對本身的硬盤狀態有一個基本瞭解。函數

 

4、SMART的值工具

 

  一、臨界值(Threshold) 
  臨界值是硬盤廠商指定的表示某一項目可靠性的門限值,也稱閾值,它經過特定公式計算而得。若是某個參數的當前值接近了臨界值,就意味着硬盤將變得不可靠,可能致使數據丟失或者硬盤故障。因爲臨界值是硬盤廠商根據本身產品特性而肯定的,所以用廠商提供的專用檢測軟件每每會跟Windows下檢測軟件的檢測結果有較大出入。 
  以參數Raw Read Error Rate(底層數據讀取錯誤率)爲例:某型硬盤對該參數的計算公式爲「10×log10(主機和硬盤之間所傳輸數據的扇區數)×512×8/重讀的扇區數」。其中「512×8」是把扇區數轉化爲所傳輸的數據位(bits),這個值只在所傳輸的數據位處於1010~1012範圍時才做計算,而當Windows系統啓動後,主機和硬盤之間所傳輸的數據扇區大於或等於1012時,此值將從新復位,因此有些值在不一樣的操做環境、不一樣檢測程序下時會有較大的波動。性能

 

  二、當前值(Normalized value) 
  當前值是各ID項在硬盤運行時根據實測數據經過公式計算的結果,計算公式由硬盤廠家自定。 
  硬盤出廠時各ID項目都有一個預設的最大正常值,也即出廠值,這個預設的依據及計算方法爲硬盤廠家保密,不一樣型號的硬盤都不一樣,最大正常值一般爲100或200或253,新硬盤剛開始使用時顯示的當前值能夠認爲是預設的最大正常值(有些ID項如溫度等除外)。隨着使用損耗或出現錯誤,當前值會根據實測數據而不斷刷新並逐漸減少。所以,當前值接近臨界值就意味着硬盤壽命的減小,發生故障的可能性增大,因此當前值也是斷定硬盤健康狀態或推測壽命的依據之一。

  

  三、最差值(Worst) 
  最差值是硬盤運行時各ID項曾出現過的最大的非正常值。 
  最差值是對硬盤運行中某項數據變劣的峯值統計,該數值也會不斷刷新。一般,最差值與當前值是相等的,若是最差值出現較大的波動(小於當前值),代表硬盤曾出現錯誤或曾經歷過惡劣的工做環境(如溫度)。

  

  四、數據值(Data或Raw value) 
  數據值是硬盤運行時各項參數的實測值,大部分SMART工具以十進制顯示數據。 
  數據值表明的意義隨參數而定,大體能夠分爲三類: 
  1)數據值並不直接反映硬盤狀態,必須通過硬盤內置的計算公式換算成當前值才能得出結果; 
  2)數據值是直接累計的,如Start/Stop Count(啓動/中止計數)的數據是50,即表示該硬盤從出廠到如今累計啓停了50次; 
  3)有些參數的數據是即時數,如Temperature(溫度)的數據值是44,表示硬盤的當前溫度是44℃。 
  所以,有些參數直接查看數據也能大體瞭解硬盤目前的工做狀態。

 

5、狀態(Status)

  

  硬盤的每項SMART信息中都有一個臨界值(閾值),不一樣硬盤的臨界值是不一樣的,SMART針對各項的當前值、最差值和臨界值的比較結果以及數據值進行分析後,提供硬盤當前的評估狀態,也是咱們直觀判斷硬盤健康狀態的重要信息。根據SMART的規定,狀態通常有正常、警告、故障或錯誤三種狀態。

  SMART斷定這三個狀態與SMART的 Pre-failure/advisory BIT(預測錯誤/發現位)參數的賦值密切相關,當Pre-failure/advisory BIT=0,而且當前值、最差值遠大於臨界值的狀況下,爲正常標誌。當Pre-failure/advisory BIT=0,而且當前值、最差值大於但接近臨界值時,爲警告標誌;當Pre-failure/advisory BIT=1,而且當前值、最差值小於臨界值時,爲故障或錯誤標誌。

 

6、SMART參數詳解

  

  通常狀況下,用戶只要觀察當前值、最差值和臨界值的關係,並注意狀態提示信息便可大體瞭解硬盤的健康情況。下面簡單介紹各參數的含義,以紅色標出的項目是壽命關鍵項,藍色爲固態硬盤(SSD)特有的項目。 
  在基於閃存的固態硬盤中,存儲單元分爲兩類:SLC(Single Layer Cell,單層單元)和MLC(Multi-Level Cell,多層單元)。SLC成本高、容量小、但讀寫速度快,可靠性高,擦寫次數可高達100000次,比MLC高10倍。而MLC雖容量大、成本低,但其性能大幅落後於SLC。爲了保證MLC的壽命,控制芯片還要有智能磨損平衡技術算法,使每一個存儲單元的寫入次數能夠平均分攤,以達到100萬小時的平均無端障時間。所以固態硬盤有許多SMART參數是機械硬盤所沒有的,如存儲單元的擦寫次數、備用塊統計等等,這些新增項大都由廠家自定義,有些尚無詳細的解釋,有些解釋也未必準確,此處也只是僅供參考。下面凡未註明廠商的固態硬盤特有的項均爲SandForce主控芯片特有的,其它廠商各自單獨註明。

  

  01(001)底層數據讀取錯誤率 Raw Read Error Rate
  數據爲0或任意值,當前值應遠大於與臨界值。 
  底層數據讀取錯誤率是磁頭從磁盤表面讀取數據時出現的錯誤,對某些硬盤來講,大於0的數據代表磁盤表面或者讀寫磁頭髮生問題,如介質損傷、磁頭污染、磁頭共振等等。不過對希捷硬盤來講,許多硬盤的這一項會有很大的數據量,這不表明有任何問題,主要是看當前值降低的程度。 
  在固態硬盤中,此項的數據值包含了可校訂的錯誤與不可校訂的RAISE錯誤(UECC+URAISE)。

  注:RAISE(Redundant Array of Independent Silicon Elements)意爲獨立硅元素冗餘陣列,是固態硬盤特有的一種冗餘恢復技術,保證內部有相似RAID陣列的數據安全性。

  

  02(002)磁盤讀寫通量性能 Throughput Performance
  此參數表示硬盤的讀寫通量性能,數據值越大越好。當前值若是偏低或趨近臨界值,表示硬盤存在嚴重的問題,但如今的硬盤一般顯示數據值爲0或根本不顯示此項,通常在進行了人工脫機SMART測試後纔會有數據量。

  

  03(003)主軸起旋時間 Spin Up Time
  主軸起旋時間就是主軸電機從啓動至達到額定轉速所用的時間,數據值直接顯示時間,單位爲毫秒或者秒,所以數據值越小越好。不過對於正常硬盤來講,這一項僅僅是一個參考值,硬盤每次的啓動時間都不相同,某次啓動的稍慢些也不表示就有問題。
  硬盤的主軸電機從啓動至達到額定轉速大體須要4秒~15秒左右,過長的啓動時間說明電機驅動電路或者軸承機構有問題。旦這一參數的數據值在某些型號的硬盤上老是爲0,這就要看當前值和最差值來判斷了。 
  對於固態硬盤來講,全部的數據都是保存在半導體集成電路中,沒有主軸電機,因此這項沒有意義,數據固定爲0,當前值固定爲100。

  

  04(004)啓停計數 Start/Stop Count
  這一參數的數據是累計值,表示硬盤主軸電機啓動/中止的次數,新硬盤一般只有幾回,之後會逐漸增長。系統的某些功能如空閒時關閉硬盤等會使硬盤啓動/中止的次數大爲增長,在排除定時功能的影響下,太高的啓動/中止次數(遠大於通電次數0C)暗示硬盤電機及其驅動電路可能有問題。 
  這個參數的當前值是依據某種公式計算的結果,例如對希捷某硬盤來講臨界值爲20,當前值是經過公式「100-(啓停計數/1024)」計算得出的。若新硬盤的啓停計數爲0,當前值爲100-(0/1024)=100,隨着啓停次數的增長,該值不斷降低,當啓停次數達到81920次時,當前值爲100-(81920/1024)=20,已達到臨界值,表示從啓停次數來看,該硬盤已達設計壽命,固然這只是個壽命參考值,並不具備肯定的指標性。 
  這一項對於固態硬盤一樣沒有意義,數據固定爲0,當前值固定爲100。

  

  05(005)重映射扇區計數 Reallocated Sectors Count/ 退役塊計數 Retired Block Count
  數據應爲0,當前值應遠大於臨界值。
  當硬盤的某扇區持續出現讀/寫/校驗錯誤時,硬盤固件程序會將這個扇區的物理地址加入缺陷表(G-list),將該地址從新定向到預先保留的備用扇區並將其中的數據一併轉移,這就稱爲重映射。執行重映射操做後的硬盤在Windows常規檢測中是沒法發現不良扇區的,因其地址已被指向備用扇區,這等於屏蔽了不良扇區。 
  這項參數的數據值直接表示已經被重映射扇區的數量,當前值則隨着數據值的增長而持續降低。當發現此項的數據值不爲零時,要密切注意其發展趨勢,若能長期保持穩定,則硬盤還能夠正常運行;若數據值不斷上升,說明不良扇區不斷增長,硬盤已處於不穩定狀態,應當考慮更換了。若是當前值接近或已到達臨界值(此時的數據值並不必定很大,由於不一樣硬盤保留的備用扇區數並不相同),表示缺陷表已滿或備用扇區已用盡,已經失去了重映射功能,再出現不良扇區就會顯現出來並直接致使數據丟失。 
  這一項不只是硬盤的壽命關鍵參數,並且重映射扇區的數量也直接影響硬盤的性能,例如某些硬盤會出現數據量很大,但當前值降低不明顯的狀況,這種硬盤儘管還可正常運行,但也不宜繼續使用。由於備用扇區都是位於磁盤尾部(靠近盤片軸心處),大量的使用備用扇區會使尋道時間增長,硬盤性能明顯降低。 
  這個參數在機械硬盤上是很是敏感的,而對於固態硬盤來講一樣具備重要意義。閃存的壽命是正態分佈的,例如說MLC能寫入一萬次以上,實際上說的是寫入一萬次以前不會發生「批量損壞」,但某些單元可能寫入幾十次就損壞了。換言之,機械硬盤的盤片不會因讀寫而損壞,出現不良扇區大多與工藝質量相關,而閃存的讀寫次數則是有限的,於是損壞是正常的。因此固態硬盤在製造時也保留了必定的空間,當某個存儲單元出現問題後即把損壞的部分隔離,用好的部分來頂替。這一替換方法和機械硬盤的扇區重映射是一個道理,只不過機械硬盤正常時極少有重映射操做,而對於固態硬盤是常常性的。 
  在固態硬盤中這一項的數據會隨着使用而不斷增加,只要增加的速度保持穩定就能夠。一般狀況下,數據值=100-(100×被替換塊/必需塊總數),所以也能夠估算出硬盤的剩餘壽命。 
  Intel固態硬盤型號的第十二個字母表示了兩種規格,該字母爲1表示第一代的50納米技術的SSD,爲2表示第二代的34納米技術的SSD,如SSDSA2M160G2GN就表示是34nm的SSD。因此參數的查看也有兩種狀況: 
  50nm的SSD(一代)要看當前值。這個值初始是100,當出現替換塊的時候這個值並不會當即變化,一直到已替換四個塊時這個值變爲1,以後每增長四個塊當前值就+1。也就是100對應0~3個塊,1對應4~7個塊,2對應8~11個塊…… 
  34nm的SSD(二代)直接查看數據值,數據值直接表示有多少個被替換的塊。

  

  06(006)讀取通道餘量 Read Channel Margin
  這一項功能不明,如今的硬盤也不顯示這一項。

 

  07(007)尋道錯誤率 Seek Error Rate
  數據應爲0,當前值應遠大於與臨界值。 
  這一項表示磁頭尋道時的錯誤率,有衆多因素可致使尋道錯誤率上升,如磁頭組件的機械系統、伺服電路有局部問題,盤片表面介質不良,硬盤溫度太高等等。 
  一般此項的數據應爲0,但對希捷硬盤來講,即便是新硬盤,這一項也可能有很大的數據量,這不表明有任何問題,仍是要看當前值是否降低。

 

  08(008)尋道性能 Seek Time Performance
  此項表示硬盤尋道操做的平均性能(尋道速度),一般與前一項(尋道錯誤率)相關聯。當前值持續降低標誌着磁頭組件、尋道電機或伺服電路出現問題,但如今許多硬盤並不顯示這一項。

 

  09(009)通電時間累計 Power-On Time Count (POH)
  這個參數的含義一目瞭然,表示硬盤通電的時間,數據值直接累計了設備通電的時長,新硬盤固然應該接近0,但不一樣硬盤的計數單位有所不一樣,有以小時計數的,也有以分、秒甚至30秒爲單位的,這由磁盤製造商來定義。 
  這一參數的臨界值一般爲0,當前值隨着硬盤通電時間增長會逐漸降低,接近臨界值代表硬盤已接近預計的設計壽命,固然這並不代表硬盤將出現故障或當即報廢。參考磁盤製造商給出的該型號硬盤的MTBF(平均無端障時間)值,能夠大體估計剩餘壽命或故障機率。 
  對於固態硬盤,要注意「設備優先電源管理功能(device initiated power management,DIPM)」會影響這個統計:若是啓用了DIPM,持續通電計數裏就不包括睡眠時間;若是關閉了DIPM功能,那麼活動、空閒和睡眠三種狀態的時間都會被統計在內。

 

  0A(010)主軸起旋重試次數 Spin up Retry Count
  數據應爲0,當前值應大於臨界值。 
  主軸起旋重試次數的數據值就是主軸電機嘗試從新啓動的計數,即主軸電機啓動後在規定的時間裏未能成功達到額定轉速而嘗試再次啓動的次數。數據量的增長表示電機驅動電路或是機械子系統出現問題,整機供電不足也會致使這一問題。

 

  0B(011)磁頭校準重試計數 Calibration Retry Count
  數據應爲0,當前值應遠大於與臨界值。
  硬盤在溫度發生變化時,機械部件(特別是盤片)會因熱脹冷縮出現形變,所以須要執行磁頭校準操做消除偏差,有的硬盤還內置了磁頭定時校準功能。這一項記錄了須要再次校準(一般因上次校準失敗)的次數。 
  這一項的數據量增長,表示電機驅動電路或是機械子系統出現問題,但有些型號的新硬盤也有必定的數據量,並不表示有問題,還要看當前值和最差值。

 

  0C(012)通電週期計數 Power Cycle Count
  通電週期計數的數據值表示了硬盤通電/斷電的次數,即電源開關次數的累計,新硬盤一般只有幾回。 
  這一項與啓停計數(04)是有區別的,通常來講,硬盤通電/斷電意味着計算機的開機與關機,因此經歷一次開關機數據纔會加1;而啓停計數(04)表示硬盤主軸電機的啓動/中止(硬盤在運行時可能屢次啓停,如系統進入休眠或被設置爲空閒多少時間而關閉)。因此大多狀況下這個通電/斷電的次數會小於啓停計數(04)的次數。

  一般,硬盤設計的通電次數都很高,如至少5000次,所以這一計數只是壽命參考值,自己不具指標性。

 

  0D(013)軟件讀取錯誤率 Soft Read Error Rate
  軟件讀取錯誤率也稱爲可校訂的讀取誤碼率,就是報告給操做系統的未經校訂的讀取錯誤。數據值越低越好,太高則可能暗示盤片磁介質有問題。

 

  AA(170)壞塊增加計數 Grown Failing Block Count(Micron 鎂光)
  讀寫失敗的塊增加的總數。

 

  AB(171)編程失敗塊計數 Program Fail Block Count
  Flash編程失敗塊的數量。

 

  AC(172)擦寫失敗塊計數 Erase Fail Block Count
  擦寫失敗塊的數量。

 

  AD(173)磨損平衡操做次數(平均擦寫次數) / Wear Leveling Count(Micron 鎂光)
  全部好塊的平均擦寫次數。 
  Flash芯片有寫入次數限制,當使用FAT文件系統時,須要頻繁地更新文件分配表。若是閃存的某些區域讀寫過於頻繁,就會比其它區域磨損的更快,這將明顯縮短整個硬盤的壽命(即使其它區域的擦寫次數還遠小於最大限制)。因此,若是讓整個區域具備均勻的寫入量,就可明顯延長芯片壽命,這稱爲磨損均衡措施。

 

  AE(174)意外失電計數 Unexpected Power Loss Count
  硬盤自啓用後發生意外斷電事件的次數。

 

  B1(177)磨損範圍對比值 Wear Range Delta
  磨損最重的塊與磨損最輕的塊的磨損百分比之差。

 

  B4(180)未用的備用塊計數 Unused Reserved Block Count Total(惠普)
  固態硬盤會保留一些容量來準備替換損壞的存儲單元,因此可用的預留空間數很是重要。這個參數的當前值表示的是還沒有使用的預留的存儲單元數量。

 

  B5(181)編程失敗計數 Program Fail Count
  用4個字節顯示已編程失敗的次數,與(AB)參數類似。

 
  B5(181)非4KB對齊訪問數 Non-4k Aligned Access(Micron 鎂光)

  B6(182)擦寫失敗計數 Erase Fail Count
  用4個字節顯示硬盤自啓用後塊擦寫失敗的次數,與(AC)參數類似。

 

  B7(183)串口降速錯誤計數 SATA Downshift Error Count
  這一項表示了SATA接口速率錯誤降低的次數。一般硬盤與主板之間的兼容問題會致使SATA傳輸級別降級運行。

 

  B8(184)I/O錯誤檢測與校訂 I/O Error Detection and Correction(IOEDC)
  「I/O錯誤檢測與校訂」是惠普公司專有的SMART IV技術的一部分,與其餘製造商的I/O錯誤檢測和校訂架構同樣,它記錄了數據經過驅動器內部高速緩存RAM傳輸到主機時的奇偶校驗錯誤數量。 
  B8(184)點到點錯誤檢測計數 End to End Error Detection Count
  Intel第二代的34nm固態硬盤有點到點錯誤檢測計數這一項。固態硬盤裏有一個LBA(logical block addressing,邏輯塊地址)記錄,這一項顯示了SSD內部邏輯塊地址與真實物理地址間映射的出錯次數。 
  B8(184)原始壞塊數 Init Bad Block Count(Indilinx芯片)
  硬盤出廠時已有的壞塊數量。

 

  B9(185)磁頭穩定性 Head Stability(西部數據)
  意義不明。

 

  BA(186)感應運算振動檢測 nduced Op-Vibration Detection(西部數據)
  意義不明。

 

  BB(187)沒法校訂的錯誤 Reported Uncorrectable Errors(希捷)
  報告給操做系統的沒法經過硬件ECC校訂的錯誤。若是數據值不爲零,就應該備份硬盤上的數據了。 
  報告給操做系統的在全部存取命令中出現的沒法校訂的RAISE(URAISE)錯誤。

 

  BC(188)命令超時 Command Timeout
  因爲硬盤超時致使操做終止的次數。一般數據值應爲0,若是遠大於零,最有可能出現的是電源供電問題或者數據線氧化導致接觸不良,也多是硬盤出現嚴重問題。

 

  BD(189)高飛寫入 High Fly Writes
  磁頭飛行高度監視裝置能夠提升讀寫的可靠性,這一裝置時刻監測磁頭的飛行高度是否在正常範圍來保證可靠的寫入數據。若是磁頭的飛行高度出現誤差,寫入操做就會中止,而後嘗試從新寫入或者換一個位置寫入。這種持續的監測過程提升了寫入數據的可靠性,同時也下降了讀取錯誤率。這一項的數據值就統計了寫入時磁頭飛行高度出現誤差的次數。

   BD(189)出廠壞塊計數 Factory Bad Block Count(Micron 鎂光芯片)

 

  BE(190)氣流溫度 Airflow Temperature
  這一項表示的是硬盤內部盤片表面的氣流溫度。在希捷公司的某些硬盤中,當前值=(100-當前溫度),所以氣流溫度越高,當前值就越低,最差值則是當前值曾經到達過的最低點,臨界值由製造商定義的最高容許溫度來肯定,而數據值不具實際意義。許多硬盤也沒有這一項參數。

 

  BF(191)衝擊錯誤率 G-sense error rate
  這一項的數據值記錄了硬盤受到機械衝擊致使出錯的頻度。

 

  C0(192)斷電返回計數 Power-Off Retract Count
  當計算機關機或意外斷電時,硬盤的磁頭都要返回停靠區,不能停留在盤片的數據區裏。正常關機時電源會給硬盤一個通知,即Standby Immediate,就是說主機要求將緩存數據寫入硬盤,而後就準備關機斷電了(休眠、待機也是如此);意外斷電則表示硬盤在未收到關機通知時就失電,此時磁頭會自動復位,迅速離開盤片。 
  這個參數的數據值累計了磁頭返回的次數。但要注意這個參數對某些硬盤來講僅記錄意外斷電時磁頭的返回動做;而某些硬盤記錄了全部(包括休眠、待機,但不包括關機時)的磁頭返回動做;還有些硬盤這一項沒有記錄。所以這一參數的數據值在某些硬盤上持續爲0或稍大於0,但在另外的硬盤上則會大於通電週期計數(0C)或啓停計數(04)的數據。在一些新型節能硬盤中,這一參數的數據量還與硬盤的節能設計相關,可能會遠大於通電週期計數(0C)或啓停計數(04)的數據,但又遠小於磁頭加載/卸載計數(C1)的數據量。 
  對於固態硬盤來講,雖然沒有磁頭的加載/卸載操做,但這一項的數據量仍然表明了不安全關機,即發生意外斷電的次數。

 

  C1(193)磁頭加載/卸載計數 Load/Unload Cycle Count
  對於過去的硬盤來講,盤片中止旋轉時磁頭臂停靠於盤片中心軸處的停泊區,磁頭與盤片接觸,只有當盤片旋轉到必定轉速時,磁頭纔開始漂浮於盤片之上並開始向外側移動至數據區。這使得磁頭在硬盤啓停時都與盤片發生摩擦,雖然盤片的停泊區不存儲數據,但無疑啓停一個循環,就使磁頭經歷兩次磨損。因此對之前的硬盤來講,磁頭起降(加載/卸載)次數是一項重要的壽命關鍵參數。 
  而在現代硬盤中,平時磁頭臂是停靠於盤片以外的一個專門設計的停靠架上,遠離盤片。只有當盤片旋轉達到額定轉速後,磁頭臂纔開始向內(盤片軸心)轉動使磁頭移至盤片區域(加載),磁頭臂向外轉動返回至停靠架即卸載。這樣就完全杜絕了硬盤啓停時磁頭與盤片接觸的現象,西部數據公司將其稱爲「斜坡加載技術」。因爲磁頭在加載/卸載過程當中始終不與盤片接觸,不存在磁頭的磨損,使得這一參數的重要性已經大大降低。 
  這個參數的數據值就是磁頭執行加載/卸載操做的累計次數。從原理上講,這個加載/卸載次數應當與硬盤的啓停次數至關,但對於筆記本內置硬盤以及臺式機新型節能硬盤來講,這一項的數據量會很大。這是由於磁頭臂組件設計有一個固定的返回力矩,保證在乎外斷電時磁頭能靠彈簧力自動離開盤片半徑範圍,迅速返回停靠架。因此要讓硬盤運行時磁頭保持在盤片的半徑以內,就要使磁頭臂驅動電機(尋道電機)持續通以電流。而讓磁頭臂在硬盤空閒幾分鐘後就當即執行卸載動做,返回到停靠架上,既有利於節能,又下降了硬盤受外力衝擊致使磁頭與盤片接觸的機率。雖然再次加載會增長一點尋道時間,但畢竟弊大於利,因此在這類硬盤中磁頭的加載/卸載次數會遠遠大於通電週期計數(0C)或啓停計數(04)的數據量。不過這種加載/卸載方式已經沒有了磁頭與盤片的接觸,因此設計值也已大大增長,一般筆記本內置硬盤的磁頭加載/卸載額定值在30~60萬次,而臺式機新型節能硬盤的磁頭加載/卸載設計值可達一百萬次。

 

  C2(194)溫度 Temperature
  溫度的數據值直接表示了硬盤內部的當前溫度。硬盤運行時最好不要超過45℃,溫度太高雖不會致使數據丟失,但引發的機械變形會致使尋道與讀寫錯誤率上升,下降硬盤性能。硬盤的最高容許運行溫度可查看硬盤廠商給出的數據,通常不會超過60℃。 
  不一樣廠家對溫度參數的當前值、最差值和臨界值有不一樣的表示方法:希捷公司某些硬盤的當前值就是實際溫度(攝氏)值,最差值則是曾經達到過的最高溫度,臨界值不具意義;而西部數據公司一些硬盤的最差值是溫度上升到某值後的時間函數,每次升溫後的持續時間都將致使最差值逐漸降低,當前值則與當前溫度成反比,即當前溫度越高,當前值越低,隨實際溫度波動。

 

  C3(195)硬件ECC校訂 Hardware ECC Recovered
  ECC(Error Correcting Code)的意思是「錯誤檢查和糾正」,這個技術可以允許錯誤,並能夠將錯誤更正,使讀寫操做得以持續進行,不致因錯誤而中斷。這一項的數據值記錄了磁頭在盤片上讀寫時經過ECC技術校訂錯誤的次數,不過許多硬盤有其製造商特定的數據結構,所以數據量的大小並不能直接說明問題。 
  C3(195)實時沒法校訂錯誤計數 On the fly ECC Uncorrectable Error Count
  這一參數記錄了沒法校訂(UECC)的錯誤數量。 
  C3(195)編程錯誤塊計數 Program Failure block Count(Indilinx芯片)

 

  C4(196)重映射事件計數 Reallocetion Events Count
  數據應爲0,當前值應遠大於臨界值。 
  這個參數的數據值記錄了將重映射扇區的數據轉移到備用扇區的嘗試次數,是重映射操做的累計值,成功的轉移和不成功的轉移都會被計數。所以這一參數與重映射扇區計數(05)類似,都是反映硬盤已經存在不良扇區。 
  C4(196)擦除錯誤塊計數 Erase Failure block Count(Indilinx芯片)
  在固態硬盤中,這一參數記錄了被重映射的塊編程失敗的數量。

 

  C5(197)當前待映射扇區計數 Current Pending Sector Count
  數據應爲0,當前值應遠大於臨界值。
  這個參數的數據表示了「不穩定的」扇區數,即等待被映射的扇區(也稱「被掛起的扇區」)數量。若是不穩定的扇區隨後被讀寫成功,該扇區就再也不列入等待範圍,數據值就會降低。 
  僅僅讀取時出錯的扇區並不會致使重映射,只是被列入「等待」,也許之後讀取就沒有問題,因此只有在寫入失敗時纔會發生重映射。下次對該扇區寫入時若是繼續出錯,就會產生一次重映射操做,此時重映射扇區計數(05)與重映射事件計數(C4)的數據值增長,此參數的數據值降低。
  C5(197)讀取錯誤塊計數(不可修復錯誤)Read Failure block Count(Indilinx芯片)

 

  C6(198)脫機沒法校訂的扇區計數 Offline Uncorrectable Sector Count
  數據應爲0,當前值應遠大於臨界值。
  這個參數的數據累計了讀寫扇區時發生的沒法校訂的錯誤總數。數據值上升代表盤片表面介質或機械子系統出現問題,有些扇區確定已經不能讀取,若是有文件正在使用這些扇區,操做系統會返回讀盤錯誤的信息。下一次寫操做時會對該扇區執行重映射。 
  C6(198)總讀取頁數 Total Count of Read Sectors(Indilinx芯片)

 

  C7(199)Ultra ATA訪問校驗錯誤率 Ultra ATA CRC Error Rate
  這個參數的數據值累計了經過接口循環冗餘校驗(Interface Cyclic Redundancy Check,ICRC)發現的數據線傳輸錯誤的次數。若是數據值不爲0且持續增加,表示硬盤控制器→數據線→硬盤接口出現錯誤,劣質的數據線、接口接觸不良均可能致使此現象。因爲這一項的數據值不會復零,因此某些新硬盤也會出現必定的數據量,只要更換數據線後數據值再也不繼續增加,即表示問題已獲得解決。 
  C7(199)總寫入頁數 Total Count of Write Sectors(Indilinx芯片)

 

  C8(200)寫入錯誤率 Write Error Rate / 多區域錯誤率 Multi-Zone Error Rate(西部數據)
  數據應爲0,當前值應遠大於臨界值。 
  這個參數的數據累計了向扇區寫入數據時出現錯誤的總數。有的新硬盤也會有必定的數據量,若數據值持續快速升高(當前值偏低),表示盤片、磁頭組件可能有問題。 
  C8(200)總讀取指令數 Total Count of Read Command(Indilinx芯片)

 

  C9(201)脫道錯誤率 Off Track Error Rate / 邏輯讀取錯誤率 Soft Read Error Rate
  數據值累積了讀取時脫軌的錯誤數量,若是數據值不爲0,最好備份硬盤上的資料。 
  C9(201)TA Counter Detected(意義不明)
  C9(201)寫入指令總數 Total Count of Write Command(Indilinx芯片)

 

  CA(202)數據地址標記錯誤 Data Address Mark errors
  此項的數據值越低越好(或者由製造商定義)。 
  CA(202)TA Counter Increased(意義不明)
  CA(202)剩餘壽命 Percentage Of The Rated Lifetime Used(Micron 鎂光芯片)
  當前值從100開始降低至0,表示全部塊的擦寫餘量統計。計算方法是以MLC擦寫次數除以50,SLC擦寫次數除以1000,結果取整數,將其與100的差值做爲當前值(MLC預計擦寫次數爲5000,SLC預計擦寫次數爲100000)。 
  CA(202)閃存總錯誤bit數 Total Count of error bits from flash(Indilinx芯片)

 

  CB(203)軟件ECC錯誤數 Run Out Cancel
  錯誤檢查和糾正(ECC)出錯的頻度。 
  CB(203)校訂bit錯誤的總讀取頁數 Total Count of Read Sectors with correct bits error(Indilinx芯片)

 

  CC(204)軟件ECC校訂 Soft ECC Correction
  經過軟件ECC糾正錯誤的計數。 
  CC(204)壞塊滿標誌 Bad Block Full Flag(Indilinx芯片)

 

  CD(205)熱騷動錯誤率 Thermal Asperity Rate (TAR)
  由超溫致使的錯誤。數據值應爲0。 
  CD(205)最大可編程/擦除次數 Max P/E Count(Indilinx芯片)

 

  CE(206)磁頭飛行高度 Flying Height
  磁頭距離盤片表面的垂直距離。高度太低則增長了磁頭與盤片接觸致使損壞的可能性;高度偏高則增大了讀寫錯誤率。不過準確地說,硬盤中並無任何裝置能夠直接測出磁頭的飛行高度,製造商也只是根據磁頭讀取的信號強度來推算磁頭飛行高度。 
  CE(206)底層數據寫入出錯率 Write Error Rate
  CE(206)最小擦寫次數 Erase Count Min(Indilinx芯片)

 

  CF(207)主軸過電流 Spin High Current
  數據值記錄了主軸電機運行時出現浪涌電流的次數,數據量的增長意味着軸承或電機可能有問題。 
  CF(207)最大擦寫次數 Erase Count Max(Indilinx芯片)

 

  D0(208)主軸電機重啓次數 Spin Buzz
  數據值記錄了主軸電機反覆嘗試啓動的次數,這一般是因爲電源供電不足引發的。 
  D0(208)平均擦寫次數Erase Count Average(Indilinx芯片)

 

  D1(209)脫機尋道性能 Offline Seek Performance
  這一項表示驅動器在脫機狀態下的尋道性能,一般用於工廠內部測試。 
  D1(209)剩餘壽命百分比 Remaining Life %(Indilinx芯片)

 

  D2(210)斜坡加載值 Ramp Load Value
  這一項僅見於幾年前邁拓製造的部分硬盤。一般數據值爲0,意義不明。 
  D2(210)壞塊管理錯誤日誌 BBM Error Log(Indilinx芯片)

 

  D3(211)寫入時振動 Vibration During Write
  寫入數據時受到受到外部振動的記錄。 
  D3(211)SATA主機接口CRC寫入錯誤計數 SATA Error Count CRC (Write)(Indilinx芯片)

 

  D4(212)寫入時衝擊 Shock During Write
  寫入數據時受到受到外部機械衝擊的記錄。 
  D4(212)SATA主機接口讀取錯誤計數 SATA Error Count Count CRC (Read)(Indilinx芯片)

 

  DC(220)盤片偏移量 Disk Shift
  硬盤中的盤片相對主軸的偏移量(一般是受外力衝擊或溫度變化所致),單位未知,數據值越小越好。

 

  DD(221)衝擊錯誤率 G-sense error rate
  與(BF)相同,數據值記錄了硬盤受到外部機械衝擊或振動致使出錯的頻度。

 

  DE(222)磁頭尋道時間累計 Loaded Hours
  磁頭臂組件運行的小時數,即尋道電機運行時間累計。

 

  DF(223)磁頭加載/卸載重試計數 Load/Unload Retry Count
  這一項與(C1)項相似,數據值累積了磁頭嘗試從新加載/卸載的次數。

 

  E0(224)磁頭阻力 Load Friction
  磁頭工做時受到的機械部件的阻力。

 

  E1(225)主機寫入數據量 Host Writes
  因爲閃存的擦寫次數是有限的,因此這項是固態硬盤特有的統計。Intel的SSD是每當向硬盤寫入了65536個扇區,這一項的數據就+1。若是用HDTune等軟件查看SMART時能夠本身計算,Intel SSD Toolbox已經爲你算好了,直接就顯示了曾向SSD中寫入過的數據量。

 

  E2(226)磁頭加載時間累計 Load 'In'-time
  磁頭組件運行時間的累積數,即磁頭臂不在停靠區的時間,與(DE)項類似。

 

  E3(227)扭矩放大計數 Torque Amplification Count
  主軸電機試圖提升扭矩來補償盤片轉速變化的次數。當主軸軸承存在問題時,主軸電機會嘗試增長驅動力使盤片穩定旋轉。這個參數的當前值降低,說明硬盤的機械子系統出現了嚴重的問題。

 

  E4(228)斷電返回計數 Power-Off Retract Cycle
  數據值累計了磁頭因設備意外斷電而自動返回的次數,與(C0)項類似。

 

  E6(230)GMR磁頭振幅 GMR Head Amplitude
  磁頭「抖動」,即正向/反向往復運動的距離。

 

  E7(231)溫度 Temperature
  溫度的數據值直接表示了硬盤內部的當前溫度,與(C2)項相同。 
  E7(231)剩餘壽命 SSD Life Left
  剩餘壽命是基於P/E週期與可用的備用塊做出的預測。新硬盤爲100;10表示PE週期已到設計值,但尚有足夠的保留塊;0表示保留塊不足,硬盤將處於只讀方式以便備份數據。

 

  E8(232)壽命餘量 Endurance Remaining
  壽命餘量是指硬盤已擦寫次數與設計最大可擦寫次數的百分比,與(CA)項類似。 
  E8(232)預留空間剩餘量 Available Reserved Space(Intel芯片)
  對於Intel的SSD來講,前邊05項提到會保留一些容量來準備替換損壞的存儲單元,因此可用的預留空間數很是重要。當保留的空間用盡,再出現損壞的單元就將出現數據丟失,這個SSD的壽命就結束了。因此僅看05項意義並不大,這一項才最重要。這項參數能夠看當前值,新的SSD裏全部的預留空間都在,因此是100。隨着預留空間的消耗,當前值將不斷降低,減少到接近臨界值(通常是10)時,就說明只剩下10%的預留空間了,SSD的壽命將要結束。這個與(B4)項類似。

 

  E9(233)通電時間累計 Power-On Hours
  對於普通硬盤來講,這一項與(09)相同。 
  E9(233)介質磨耗指數 Media Wareout Indicator(Intel芯片)
  因爲固態硬盤的擦寫次數是有限的,當到達必定次數的時候,就會出現大量的單元同時損壞,這時候預留空間也頂不住了,因此這項參數實際上表示的是硬盤設計壽命。Intel的SSD要看當前值,隨着NAND的平均擦寫次數從0增加到最大的設計值,這一參數的當前值從開始的100逐漸降低至1爲止。這表示SSD的設計壽命已經終結。固然到達設計壽命也不必定意味着SSD就當即報廢,這與閃存芯片的品質有着很大的關係。

  注:Total Erase Count全擦寫計數是指固態硬盤中全部塊的擦寫次數的總和,不一樣規格的NAND芯片以及不一樣容量的SSD,其最大全擦寫次數均有所不一樣。

 

  F0(240)磁頭飛行時間 Head Flying Hours / 傳輸錯誤率 Transfer Error Rate(富士通)
  磁頭位於工做位置的時間。 
  富士通硬盤表示在數據傳輸時鏈接被重置的次數。

 

  F1(241)LBA寫入總數 Total LBAs Written
  LBA寫入數的累計。 
  F1(241)寫入剩餘壽命 Lifetime Writes from Host
  自硬盤啓用後主機向硬盤寫入的數據總量,以4個字節表示,每寫入64GB字節做爲一個單位。

 

  F2(242)LBA讀取總數 Total LBAs Read
  LBA讀取數的累計。某些SMART讀取工具會顯示負的數據值,是由於採用了48位LBA,而不是32位LBA。 
  F2(242)讀取剩餘壽命 Lifetime Reads from Host
  自硬盤啓用後主機從硬盤讀取的數據總量,以4個字節表示,每讀取64GB字節做爲一個單位。

 

  FA(250)讀取錯誤重試率 Read Error Retry Rate
  從磁盤上讀取時出錯的次數。

 

  FE(254)自由墜落保護 Free Fall Protection  如今有些筆記本硬盤具備自由墜落保護功能,當硬盤內置的加速度探測裝置檢測到硬盤位移時,會當即中止讀寫操做,將磁頭臂復位。這個措施防止了磁頭與盤片之間發生摩擦撞擊,提升了硬盤的抗震性能。這個參數的數據裏記錄了這一保護裝置動做的次數。

相關文章
相關標籤/搜索