CUDA SHARED MEMORY

在global Memory部分,數據對齊和連續是很重要的話題,當使用L1的時候,對齊問題可以忽略,但是非連續的獲取內存依然會降低性能。依賴於算法本質,某些情況下,非連續訪問是不可避免的。使用shared memory是另一種提高性能的方式。 GPU上的memory有兩種: On-board memory On-chip memory global memory就是一塊很大的on-board me
相關文章
相關標籤/搜索