如何將caffe的data prefetch變爲多線程預取?

在深度學習研究時,數據預取會經常成爲訓練的瓶頸,一般來說,判斷瓶頸的時候,看GPU利用率即可。通過nvidia-smi或者watch -n 1 nvidia-smi(實時刷新)都可查看GPU的利用率。 如上圖所示,GPU利用率不能完全打滿,斷斷續續的忽高忽低,大概率是因爲數據取出速度慢 (其他原因,如GPU帶寬一般不會成爲瓶頸)。除此之外,在blocking_queue.cpp中也會打印出 Wai
相關文章
相關標籤/搜索