爲何使用超算中心服務器單節點多GPU訓練反而更慢

注:pytorch訓練圖像算法 由於沒有申請多個CPU核心致使CPU加載數據等問題成爲瓶頸!!!!!! 以此博客記念逝去的兩天光陰。 能夠經過 top watch -n 1 nvidia-smi等查看硬件信息 一開始發現並無怎麼利用CPU資源覺得不是CPU的問題,其實否則。。。 一開始我覺得是cuda沒裝好 我覺得是cudnn沒裝好 我覺得是磁盤文件加載慢 我覺得是torch版本過低 我覺得是ba
相關文章
相關標籤/搜索