如何查看並準確找到佔用GPU的程序

       有時多人都在一段時間內同時使用公司共用的服務器上的GPU訓練,有的網絡的代碼寫得不好,雖然是按需獲取GPU內存但停止訓練了卻仍然佔用GPU沒放,有的則採取的是預分配機制,一開始運行加載訓練好了的模型時就佔用大量內存(比如9-10G),沒有進行識別推理也佔用內存不放,多人共用的環境如果有人用完不及時停掉相關程序,很多GPU就被佔了但空閒在那裏,但又不好隨便亂殺進程來釋放,首先得確認一下
相關文章
相關標籤/搜索