GPU 0000:3D:00.0 unknown error GPU is lost!! 問題解決

之前上一篇重新配置了系統驅動cuda後還是會報錯,懷疑是硬件的問題 從網絡到英偉達官網,再到聯想客服,一般都是兩種答案 電源供電不足,或者過熱 由於實驗室配置的是兩塊Tesla M60,只有被動散熱,而且在程序運行中使用英偉達的顯卡監測 nvidia-smi -l 發現,一旦溫度超過91°就會顯示 GPU is lost ! ! ! 且溫度上升程序運行明顯減慢 基本確定是溫度的問題,給兩塊M60單
相關文章
相關標籤/搜索