記錄,太坑了,深度學習顯卡損壞原來是這樣子的。

記錄,太坑了,深度學習顯卡損壞原來是這樣子的。 時間 2020-10-23 深度學習服務器,3張 RTX2080Ti。 損壞的是1號卡,就是夾在0號和2號卡中間的那張卡。 可能常年溫度太高,燒壞了。 事件記錄: 每過一段時間,1號卡溫度和功率會變成nan。重啓服務器就好了。 但服務器經常有任務,也不能隨便重啓,沒看到什麼問題,就不管了。 又過了一段時間。發現模型運算超慢的。還以爲那裏出問題了,查來
相關文章
相關標籤/搜索