多服務器顯卡使用狀態監控工具實現

一、前言 實驗室是做計算機視覺的,擁有幾臺服務器,每臺服務器上有1到8張數量不等的顯卡,用於同學們跑深度學習算法。每次到了會議/期刊截稿前,服務器都人滿爲患,大家各種搶顯卡用(同時佔用多張顯卡能提高程序的並行性,訓練模型花費時間變少),旱的旱死澇旳澇死,有的同學佔了十幾張卡,而有的同學天天蹲守服務器也等不到一張空閒的卡。於是,產品經理(其實是實驗室大師兄)提了個需求,讓我寫個顯卡監控工具,用於監控
相關文章
相關標籤/搜索