cuda by example

時間 2019-11-19

標籤 cuda example 简体版

原文原文鏈接

int offset= x+y*dim

x 線程塊內的線程索引

y 線程塊索引

dim 線程塊的維度

tid = threadIdx.x+blockIdx.x*blockDim.x

計算大於或等於128的最小倍數（127+x）/128

kernel<<<(x+127)/128,128>>>(a,b,c)

規約求和

int i= blockDim.x/2;
while(i != 0){
    if(cacheIndex < i)
        cache[cacheIndex] += cache[cacheIndex + i];
    __synthreads();
    i /= 2;
}

const int N = 33*1024
const int threadsperblock = 256;
const int blockpergrid = imin(32,(N+threadperblock-1)/threadsperblock);
 
kernel<<<blockpergrid,threadsperblock>>>(a,b,c);
 
__global__ static void kenel(int *a,int *b,int *c){
    ...
    int tid = threadIdx.x+blockIdx.x*blockDim.x;
    ...
    while(tid<N){
        ...
        tid += blockDim.x*gridDim.x;
        ...
    }
}

if(threadIdx.x % 2){
    ...
    __synthreads();
}

這會形成 線程發散：

當某些線程須要執行一條指令，而其餘線程不須要執行時，這種狀況成爲線程發散。

__synthreads會當全部的線程都執行後才釋放，而有些線程若是不執行，那麼kernel函數會無止境的等待。

1. CUDA By Example（五）
2. CUDA By Example（四）
3. Cuda by Example 配置
4. CUDA By Example——Julia實例
5. 《GPU高性能編程 CUDA實戰》(CUDA By Example)讀書筆記
6. CUDA + OpenCV實現CUDA By Example中波紋示例
7. RXJava by Example--轉
8. Go by Example
9. Reactor by Example--轉
10. java8 group by example
更多相關文章...
• SQLite Indexed By - SQLite教程
• SQLite Group By - SQLite教程
• RxJava操作符（一）Creating Observables
• JDK13 GA發佈：5大特性解讀

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。