踩坑 gpu跑到一個epoch就停了不跑了。。。

兩塊gpu一起跑,同樣的代碼,數據集,但是就是有一塊在一個epoch後就停了,gpu不工作了。。。 原因:在你排除掉代碼原因和硬件搭建錯誤後,只可能是,硬盤讀數據不給力了。。。。 昨晚一樣的情況,卡了一夜沒好。今天把數據放固態硬盤上,卡了蠻久就gpu接着工作了。。。。 所以,不是gpu的鍋,怪硬盤讀數據不給力了。。。。。7w x 2 的數據量啊。。。。
相關文章
相關標籤/搜索