記一次硬件故障,並普及點硬件知識

記一次硬件故障

既當故事,也作見識~服務器

始末

事情是這樣的,星期四的時候須要用工做站GPU進行AI模型訓練,因此把GPU主板驅動升級了一下,而後就運行了1天,晚上的時候暫停任務,心想着讓工做站休息一晚,明天繼續吧(那GPU運轉和產熱真是誇張啊,如今知道爲何GPU都有兩個風扇了)code

次日把工做站從新開機,發現遠程鏈接不了了,這就坑了blog

嘗試

因而先ping了一下,發下不通,而後登錄路由查看了一下,沒發現工做站,那確定是開不了機了接口

接着找了個顯示器鏈接到了工做站上,發現開機沒反應,顯示器一點變化都沒有內存

這時候學生時代兩層機房的管理經驗就用上了,把工做站拆了路由

1.GPU落灰.png

發現GPU落灰挺嚴重的,估計是大量運算捲起的灰塵,加之工做站剛安裝的時候顯卡也出現過一次接觸不良的狀況,遂拆了從新裝容器

先擰開螺絲(供電的線若是阻礙能夠先拔了,若是不影響就無論)
1.1.拆.png擴展

按一下卡扣,手握兩頭就能夠輕鬆拔下(別用蠻力,顯卡將近3k,主板將近4k)
1.2.卡扣.png硬件

我是確保這個卡槽沒問題的,要是你不肯定能夠安裝了另外一個卡槽上,工做站基本上都是多個顯卡槽
2.從新安裝.png技巧

發現開機黑屏了(這個有個技巧,關下顯示器再開,若是屏幕亮畫面黑,就是黑屏)

PS:其實開機黑屏,插拔內存就能夠解決80%的狀況

那就插拔內存試試,我這邊4個卡槽,先拔下內存條插下內存條金手指
3.內存.png

發現仍是不行,開機繼續黑屏

那就得排出是不是某內存條燒壞了,因而單個插入來試

單插外部的沒事,能夠開機,單插內部位置的內存不行

3.1.不行.png

因而得進一步排出,是卡槽出問題了,仍是內存出問題

外部內存插入裏面卡槽也開不了機,裏面位置的內存插入外部能夠開機

那麼就能夠判斷裏面卡槽出問題了,至因而落灰仍是其餘問題有待排查,先繼續說

把內部內存換個卡槽就能夠了

PS:推薦內存是一個牌子的,好比都是金士頓,有時候不太牌子的內存容易有其餘問題,之前踩過坑

而後就能夠了~

擴展

硬盤知識

順便普及一個硬盤的知識點,以某老電腦爲例:
硬盤

這個是鏈接線,經過這個電腦就能夠訪問到硬盤
4.主板到硬盤.png

PS:爲電腦或者服務器添加硬盤的時候,這個先也要買一下,並且得看一下主板上還有沒有接口

這個是電源給硬盤供電用的線
4.1.電源到硬盤.png

看張詳細圖
4.2.供電.png

改裝大佬

先申明,不推廣,不發鏈

以前朋友想買2T的WD硬盤,500左右,問我有沒有性價比高的推薦

我說3T硬盤500左右,本身買個硬盤盒就能夠用了,並且不容易壞,考慮不

PS:常常使用的狀況下:移動硬盤通常2年左右的壽命,硬盤5年左右

5.使用.png

最終效果
5.1.效果.png

缺點:須要額外供電,體積比移動硬盤大點(若是想小點能夠使用筆記本的硬盤)

PS:硬盤是3.5英寸的,筆記本硬盤是2.5英寸的,買硬盤盒須要注意一下,搞不清楚就買通用的

題外話

固然了,NAS也能夠本身改裝,多盤支持的容器+LoT+RAID 0就能夠搞定了,之後有機會繼續說

相關文章
相關標籤/搜索