Shared Memory

1、引言 在global memory部分,數據對齊和連續是提升性能的很重要的因素,當使用L1 cache的時候,對齊問題不再是問題,但是非連續的獲取內存依然會降低性能。依賴於算法本質,某些情況下,非連續訪問是不可避免的。使用shared memory是另一種提高性能的方式。 2、Introduction CUDA Shared Memory GPU上的memory有兩種: 1、On-board
相關文章
相關標籤/搜索