title: 【CUDA 基礎】5.3 減小全局內存訪問
categories:
- CUDA
- Freshman
tags:
- 共享內存
- 歸約
toc: true
date: 2018-06-04 19:47:29
Abstract: 本文介紹使用共享內存進行歸約,並比較全局內存歸約與共享內存歸約之間的性能差距
Keywords: 共享內存,歸約性能
開篇廢話
邏輯是很是重要的,一旦你學會了邏輯,不少假的東西你能夠輕鬆的識別出來,這會使你更增強大而不會被任何人或者組織洗腦。
廢話少說,開始今天的博客。
使用共享內存的主要緣由就是減小對全局內存的訪問,來減小沒必要要的延遲,第三章咱們學過了歸約,能夠參考:spa
這兩篇博客包含咱們前面使用全局內存進行歸約的各類技術,咱們幾天也要用其中一部分代碼做爲比較,來體現咱們共享內存的優點。
咱們要集中解決下面兩個問題:線程
- 如何從新安排數據訪問模式以免線程束分化
- 如何展開循環以保證有足夠的操做使指令和內存帶寬飽和
本文咱們經過對比研究前面的部分代碼,來分析爲什麼要使用共享內存,以及如何使用共享內存。3d