CUDA計算直方圖(二) 共享內存 __shared__

參考: Shane Cook. CUDA Programming: A developer’s guide to parallel computing with GPUs 共享內存 共享內存是一塊特殊的內存, 因爲它存在於芯片上並且存取速度比全局內存快. 可以在共享內存上創建一個包含256個bin的局部統計直方圖, 最後將所有共享內存上計算得到的統計直方圖通過原子操作彙總到全局內存. 這樣可以節省
相關文章
相關標籤/搜索