CUDA 共享內存

GPU設備中的共享內存比全局內存訪問效率高,一種藉助共享內存的通用辦法是,數據分塊之後,將一個線程塊中需要從全局內存中讀取的數據全部讀到共享內存中,然後線程塊中的所有線程在執行時,只需要讀取共享內存即可。 共享內存中所謂的共享是對線程塊而言,也就是說同一個線程塊中的所有線程共享這塊內存。爲了使得一個wrap中的線程可以在同一個時刻並行訪問共享內存,共享存儲器被組織成了32個bank,每個bank有
相關文章
相關標籤/搜索