Shared Memory

時間 2020-12-30

原文原文鏈接

1、引言在global memory部分，數據對齊和連續是提升性能的很重要的因素，當使用L1 cache的時候，對齊問題不再是問題，但是非連續的獲取內存依然會降低性能。依賴於算法本質，某些情況下，非連續訪問是不可避免的。使用shared memory是另一種提高性能的方式。 2、Introduction CUDA Shared Memory GPU上的memory有兩種： 1、On-board