1.故障描述ide
1臺24盤的FP5280G2機器安裝了6塊3.84T的nvme固態盤,這6塊盤的電源燈都是綠色正常,狀態燈也都沒有紅色告警,可是經過lspci命令查看實際只識別到了5塊盤。spa
2.排查過程ci
因爲raid卡不支持nvme協議的固態盤,因此沒法經過點燈來缺失究竟是那個槽位的硬盤沒法識別。這樣就只能經過命令dd if=/dev/zero of=/dev/nvme1pn1向每一個磁盤中寫入數據,而後觀察閃爍的磁盤狀態燈,逐一排查,最終來肯定是22槽位的盤沒有被識別。it
定位到了沒有被識別到的nvme固態盤,此時也不能肯定該盤是好的仍是壞的,須要經過將該塊盤與其餘槽位正常識別到的盤互換位置,而後再次經過dd命令逐一貫每塊磁盤寫入數據,觀察磁盤的狀態燈,來肯定。最後觀察發現,沒有被識別的22槽位磁盤放到0槽位是能夠被識別到的,而那塊正常的盤放到22槽位也不能被識別到。此時能夠證實,以前22槽位的盤是好的。class
既然22槽位的盤是好的,那麼問題可能就是背板、riser卡、oculink線損壞致使的22槽位硬盤不能被識別,因此我先對調了一下oculink線,發現仍是沒法識別硬盤。那麼就排除了oculink損壞的可能。範圍進一步縮小到了背板和riser卡上,這時我又把背板給替換掉了,最終22槽位的硬盤被識別到了。此時能夠肯定是背板損壞了致使22槽位nvme固態盤沒法被識別。方法
3.解決方法數據
更換背板。協議