CUDA ---- Memory Model

時間 2021-08-15

原文原文鏈接

Memory kernel性能高低是不能單純的從warp的執行上來解釋的。比如之前博文涉及到的，將block的維度設置爲warp大小的一半會導致load efficiency降低，這個問題無法用warp的調度或者並行性來解釋。根本原因是獲取global memory的方式很差勁。衆所周知，memory的操作在講求效率的語言中佔有極重的地位。low-latency和high-bandwidth是高

>>阅读原文<<